Data Science
Как объяснить относительную разницу между макро-AUC и макро-F1 в задаче многоклассовой классификации?
00
Вопрос или проблема На днях я опубликовал статью, в которой результат модели с учителем следующий. Все метрики усредненные по классу. Меня попросили прокомментировать разницу между AUC и другими метриками, в частности F1. Быстро это относительно сбалансированная задача.
Data Science
Кластеризация временных рядов с использованием динамического временного выравнивания
00
Вопрос или проблема Я хотел бы кластеризовать/сгруппировать кривые на приложенной картинке с помощью Python. Данные уже нормализованы, и мой подход заключается в использовании dtw (динамического временного выравнивания) для расчета расстояния, а затем
Data Science
Группировка похожих классов для повышения точности, при этом максимизируя количество классов.
00
Вопрос или проблема Предположим, у меня есть множество различных классов, некоторые из которых связаны между собой. Моя модель имеет высокую точность классификации для некоторых классов, в то время как другие классы сложно предсказать.
Data Science
Результат теста выше результата обучения
00
Вопрос или проблема Я реализовал классификатор наивного байесовского метода с гауссовским предположением, и у меня результат теста (99,99%) оказался выше, чем результат обучения (96,87%). Нормально это или это означает, что моя модель недостаточно обучена?
Data Science
Как мы можем использовать формулу косинусного сходства на векторе признаков документа без направления?
00
Вопрос или проблема В математике вектор имеет как величину, так и направление. В области Data Science для определения схожести документов мы преобразуем документ в вектор признаков. Затем применяем формулу косинусного угла между вектором признаков исходного и целевого документа.
Data Science
Берт и классификация SVM
00
Вопрос или проблема Я пытаюсь понять концепции в заголовке и как они соотносятся с задачей бинарной классификации. Согласно моему текущему пониманию, вы можете кодировать текст, используя различные методы извлечения признаков, такие как “
Data Science
Каковы некоторые общие советы по улучшению моего классификатора MNIST?
00
Вопрос или проблема Я создал CNN с нуля на Python с использованием Numpy, чтобы решить задачу распознавания рукописных цифр MNIST. Он состоит из свертки (3 фильтра 3×3), слоя максимального объединения (пуллинг 2×2) и выходного слоя с 10 метками.
Data Science
Как определить квадратичную взвешенную каппу в качестве метрики оценки в классификаторе CatBoost
00
Вопрос или проблема Я использую catboost для задачи многоклассовой классификации. Я хочу использовать квадратный взвешенный каппа в качестве метрики оценки. Catboost уже имеет WKappa в качестве eval_metric, но это линейная взвешенная версия, а не квадратичная.
Data Science
Классификации модели не соответствуют ожиданиям бизнеса или метрике “X”.
00
Вопрос или проблема Может ли это несоответствие быть вызвано стратегией порога? Если да, то как мне оптимизировать или скорректировать эти пороги? Как мне лучше согласовать результаты модели с бизнес-контекстом “X”
Data Science
Как классифицировать поведение при вождении (ускорение, торможение, поворот) с использованием 2D координат и скорости?
00
Вопрос или проблема Я работаю над проектом по классификации поведения водителей на основе данных о положении и скорости автомобиля. Для каждого временного шага у меня есть следующая информация: $x, y $ : Координаты положения в 2D-плоскости $V_x, V_y$
Data Science
Форма входного тензора для бинарной классификации временных рядов с использованием CNN
00
Вопрос или проблема Я хочу предсказать, выйдет ли машина из строя на основе самой последней серии измерений, полученных с помощью бортовых датчиков. У меня есть несколько десятков машин, каждая из которых имеет датчик, который делает измерение через равные интервалы.
Data Science
отдельное дерево решений для категориальных значений признаков
00
Вопрос или проблема Если использовать разные деревья решений, каждое из которых основано на определённом значении признака (например, отдельные модели для мужчин и женщин), или одно дерево решений, должны ли они давать одинаковый результат?
Data Science
Как справиться с переобучением в следующем случае классификации
00
Вопрос или проблема Матрица путаницы представлена ниже :- [[ 0 0 5 1 0 0] [ 0 0 19 14 0 0] [ 0 0 217 151 0 0] [ 0 0 84 282 0 0] [ 0 0 6 111 0 0] [ 0 0 0 10 0 0]] np.random.seed(0) classifier = Sequential() classifier.add(Dense(300,input_dim=11)) […]
Data Science
Как я могу улучшить точность своей модели? (Предсказание отмены такси)
00
Вопрос или проблема Я пытаюсь предсказать на основе нескольких параметров, таких как тип поездки, тип автомобиля, источник бронирования, время начала, время до бронирования (начало – бронирование) и несколько других параметров, отменит ли клиент бронь или нет.
Data Science
Альтернативы MultiLabelBinarizer
00
Вопрос или проблема Существует много информации о том, как обрабатывать категориальные переменные при предварительной обработке данных для классификации с использованием машинного обучения. Однако я не могу найти никаких рекомендаций о том, как обрабатывать
Data Science
Классификация шумных данных
00
Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные
Data Science
Могу ли я использовать кластеризацию после классификации для улучшения производительности моего классификатора?
00
Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью
Data Science
Как мне предсказать класс для каждого временного шага, используя информацию из предыдущих временных шагов?
00
Вопрос или проблема У меня есть задача классификации, но она отличается от обычной. Я должен предоставить 3 вывода (каждый из которых равен 0 или 1) для каждого входа из 3 временных шагов и 10 признаков. Какую архитектуру модели или подход использовать в таком типе задачи?
Data Science
Классификация нелинейных регрессий по их формам
00
Вопрос или проблема У меня есть набор данных, состоящий из тысяч индивидуальных зависимостей y ~ x, которые могут иметь разные формы. Например, они могут следовать экспоненциальному, асимптотическому, логистическому или формы с горбом (с различной ассиметрией) паттерну.
Data Science
Прогнозирование недавности-частоты-деньги (RFM) через классификацию характеристик клиентов
00
Вопрос или проблема У меня есть RFM модель, которую я использую для сегментации клиентов на основе RFM оценки. Что я хотел бы сделать: Понять больше о характеристиках моих клиентов, чем просто их RFM оценка; Суметь предсказать, к какому сегменту RFM