classification - ответы на вопросы - Page 6 of 13

Data Science

Как объяснить относительную разницу между макро-AUC и макро-F1 в задаче многоклассовой классификации?

00

Вопрос или проблема На днях я опубликовал статью, в которой результат модели с учителем следующий. Все метрики усредненные по классу. Меня попросили прокомментировать разницу между AUC и другими метриками, в частности F1. Быстро это относительно сбалансированная задача.

Data Science

Кластеризация временных рядов с использованием динамического временного выравнивания

00

Вопрос или проблема Я хотел бы кластеризовать/сгруппировать кривые на приложенной картинке с помощью Python. Данные уже нормализованы, и мой подход заключается в использовании dtw (динамического временного выравнивания) для расчета расстояния, а затем

Data Science

Группировка похожих классов для повышения точности, при этом максимизируя количество классов.

00

Вопрос или проблема Предположим, у меня есть множество различных классов, некоторые из которых связаны между собой. Моя модель имеет высокую точность классификации для некоторых классов, в то время как другие классы сложно предсказать.

Data Science

Результат теста выше результата обучения

00

Вопрос или проблема Я реализовал классификатор наивного байесовского метода с гауссовским предположением, и у меня результат теста (99,99%) оказался выше, чем результат обучения (96,87%). Нормально это или это означает, что моя модель недостаточно обучена?

Data Science

Как мы можем использовать формулу косинусного сходства на векторе признаков документа без направления?

00

Вопрос или проблема В математике вектор имеет как величину, так и направление. В области Data Science для определения схожести документов мы преобразуем документ в вектор признаков. Затем применяем формулу косинусного угла между вектором признаков исходного и целевого документа.

Data Science

Берт и классификация SVM

00

Вопрос или проблема Я пытаюсь понять концепции в заголовке и как они соотносятся с задачей бинарной классификации. Согласно моему текущему пониманию, вы можете кодировать текст, используя различные методы извлечения признаков, такие как “

Data Science

Каковы некоторые общие советы по улучшению моего классификатора MNIST?

00

Вопрос или проблема Я создал CNN с нуля на Python с использованием Numpy, чтобы решить задачу распознавания рукописных цифр MNIST. Он состоит из свертки (3 фильтра 3×3), слоя максимального объединения (пуллинг 2×2) и выходного слоя с 10 метками.

Data Science

Как определить квадратичную взвешенную каппу в качестве метрики оценки в классификаторе CatBoost

00

Вопрос или проблема Я использую catboost для задачи многоклассовой классификации. Я хочу использовать квадратный взвешенный каппа в качестве метрики оценки. Catboost уже имеет WKappa в качестве eval_metric, но это линейная взвешенная версия, а не квадратичная.

Data Science

Классификации модели не соответствуют ожиданиям бизнеса или метрике “X”.

00

Вопрос или проблема Может ли это несоответствие быть вызвано стратегией порога? Если да, то как мне оптимизировать или скорректировать эти пороги? Как мне лучше согласовать результаты модели с бизнес-контекстом “X”

Data Science

Как классифицировать поведение при вождении (ускорение, торможение, поворот) с использованием 2D координат и скорости?

00

Вопрос или проблема Я работаю над проектом по классификации поведения водителей на основе данных о положении и скорости автомобиля. Для каждого временного шага у меня есть следующая информация: $x, y $ : Координаты положения в 2D-плоскости $V_x, V_y$

Data Science

Форма входного тензора для бинарной классификации временных рядов с использованием CNN

00

Вопрос или проблема Я хочу предсказать, выйдет ли машина из строя на основе самой последней серии измерений, полученных с помощью бортовых датчиков. У меня есть несколько десятков машин, каждая из которых имеет датчик, который делает измерение через равные интервалы.

Data Science

отдельное дерево решений для категориальных значений признаков

00

Вопрос или проблема Если использовать разные деревья решений, каждое из которых основано на определённом значении признака (например, отдельные модели для мужчин и женщин), или одно дерево решений, должны ли они давать одинаковый результат?

Data Science

Как справиться с переобучением в следующем случае классификации

00

Вопрос или проблема Матрица путаницы представлена ниже :- [[ 0 0 5 1 0 0] [ 0 0 19 14 0 0] [ 0 0 217 151 0 0] [ 0 0 84 282 0 0] [ 0 0 6 111 0 0] [ 0 0 0 10 0 0]] np.random.seed(0) classifier = Sequential() classifier.add(Dense(300,input_dim=11)) […]

Data Science

Как я могу улучшить точность своей модели? (Предсказание отмены такси)

00

Вопрос или проблема Я пытаюсь предсказать на основе нескольких параметров, таких как тип поездки, тип автомобиля, источник бронирования, время начала, время до бронирования (начало – бронирование) и несколько других параметров, отменит ли клиент бронь или нет.

Data Science

Альтернативы MultiLabelBinarizer

00

Вопрос или проблема Существует много информации о том, как обрабатывать категориальные переменные при предварительной обработке данных для классификации с использованием машинного обучения. Однако я не могу найти никаких рекомендаций о том, как обрабатывать

Data Science

Классификация шумных данных

00

Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные

Data Science

Могу ли я использовать кластеризацию после классификации для улучшения производительности моего классификатора?

00

Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью

Data Science

Как мне предсказать класс для каждого временного шага, используя информацию из предыдущих временных шагов?

00

Вопрос или проблема У меня есть задача классификации, но она отличается от обычной. Я должен предоставить 3 вывода (каждый из которых равен 0 или 1) для каждого входа из 3 временных шагов и 10 признаков. Какую архитектуру модели или подход использовать в таком типе задачи?

Data Science

Классификация нелинейных регрессий по их формам

00

Вопрос или проблема У меня есть набор данных, состоящий из тысяч индивидуальных зависимостей y ~ x, которые могут иметь разные формы. Например, они могут следовать экспоненциальному, асимптотическому, логистическому или формы с горбом (с различной ассиметрией) паттерну.

Data Science

Прогнозирование недавности-частоты-деньги (RFM) через классификацию характеристик клиентов

00

Вопрос или проблема У меня есть RFM модель, которую я использую для сегментации клиентов на основе RFM оценки. Что я хотел бы сделать: Понять больше о характеристиках моих клиентов, чем просто их RFM оценка; Суметь предсказать, к какому сегменту RFM