Data Science
Почему моя ошибка на стадии валидации может перестать снижаться, в то время как ошибка на стадии обучения продолжает уменьшаться?
00
Вопрос или проблема В своем стремлении узнать немного больше о науке о данных, я извлек из интернета некоторые размеченные данные и пытаюсь классифицировать примеры на один из трех классов. Я сталкиваюсь с проблемой, что независимо от того, какую модель
Data Science
Трансформации данных в иерархической классификации
00
Вопрос или проблема Я строю иерархический текстовый классификатор, используя подход Local Classifier Per Parent Node (LCPN) с политикой ‘siblings’, как описано в обзоре иерархической классификации в различных областях применения: Например
Data Science
Бинарная + Нейтральная Классификация
00
Вопрос или проблема У меня есть набор данных постов для анализа настроений, которые помечены как -1 (негативные), 1 (позитивные) или 0 (нейтральные). Я задумываюсь над тем, как с этим работать. Вот мои идеи: создать мультиклассовый классификатор: я пробовал
Data Science
Преобразовать задачу многоклассовой классификации в многометочную проблему.
00
Вопрос или проблема Я нашел этот вопрос, но мне нужен ответ в другом направлении. Пример: Предположим, мы хотим предсказать, захочет ли человек с определенным профилем купить продукт A и/или B. Итак, у нас есть 2 бинарных класса A и B, которые не исключают
Data Science
Является ли чувствительность тем же самым, что и полнота в многоклассовой классификации?
00
Вопрос или проблема В Википедии говорится: “В двоичной классификации показатель recall называется чувствительностью” в разделе о Recall. Отличаются ли они в случае многоклассовой классификации? коротко: не совсем, recall и точность очень похожи
Data Science
Получить зависимые вероятности в многоклассовой классификации
00
Вопрос или проблема После обучения моей модели CatBoostClassifier я вызываю функцию get_proba, которая возвращает мне список вероятностей. Проблема начинается с другой стороны… Я переношу эти данные в датафрейм, затем в Excel, после чего суммирую
Data Science
Метрики оценки для многоклассовой классификации
00
Вопрос или проблема Как получить Accuracy, Detection_Rate, False_Positive_Rate и False_Negative_Rate для каждого класса? Например, все эти метрики для class_1, class_2, class_3 и т.д. Вот пример кода, который я использовал для вычисления точности классификатора
Data Science
Несбалансированность классов в наборе данных изображений
00
Вопрос или проблема Когда я работаю с несбалансированным набором данных, меня учили делать оверсэмплинг только для обучающей выборки, а не для всего набора данных, чтобы избежать переобучения, однако это касалось структурированных текстовых данных в pandas
Data Science
Классификация многомерных временных рядов для каждой группы в наборе данных
00
Вопрос или проблема Предположим, у меня есть следующий набор данных: станция | дата | мин_темп | признак2 | признак3 | снег | 1 | 01-11-11 | 1 | 5 | 22 | true | 1 | 02-11-11 | 1 | 5 | 22 | true | 2 | 01-11-11 | 1 | 5 | 22 […]
Data Science
Оценка модели с категориальными целевыми переменными
00
Вопрос или проблема Я преобразовал все числовые целевые переменные датасета MNIST в категориальные переменные. Таким образом, 0 стало ноль и так далее. Затем я попробовал следующую модель на этом наборе данных: from sklearn.linear_model import SGDClassifier from sklearn.
Data Science
Как я могу получить оценки каждого прогноза для многоклассовой модели классификации?
00
Вопрос или проблема Мне просто любопытно, и я хотел бы знать, возможно ли получить оценки для каждого предсказания в модели многоклассовой классификации. Если это возможно, как я могу реализовать это, чтобы делать предсказания на моих оригинальных наборах
Data Science
Мульти-меточная многоклассовая бинарная числовая закодированная выходная информация не может быть взвешена в torch.nn.functional.cross_entropy.
00
Вопрос или проблема У меня очень уникальная задача многометочной многоклассовой классификации. У меня есть нейронная сеть, которая выдает 6 логитов. Количество классов, которые мы пытаемся предсказать, составляет 2^6, то есть я кодирую свой вывод в двоичном формате.
Data Science
Входные данные Keras для многовариантной классификации с LSTM, используя текущие характеристики и характеристики предыдущих временных шагов и значения y.
00
Вопрос или проблема Я работаю над задачей многомерной бинарной классификации. Я хочу предсказать бинарную классификацию, учитывая признаки в текущий момент времени и данные (признаки + реальная классификация) из предыдущих моментов времени.
Data Science
Несколько целей в задаче классификации
00
Вопрос или проблема У меня есть вектор длиной $n \gt 4$, который имеет ровно 4 цели, например, [0, 0, 0, 1, 0, 1, 0, 1, 1]. Я хотел бы узнать, как я могу изменить функцию softmax для этого случая. Обычно она нормализуется так, чтобы все вероятности в сумме давали 1.
Data Science
Как обучить алгоритм машинного обучения с несколькими метками
00
Вопрос или проблема У меня есть следующая проблема, и я очень надеюсь, что есть ее решение. Я также подозреваю, что существует простой подход к этому. Я просто не вижу его в данный момент. Буду очень признателен за любую помощь или совет.
Data Science
Классификация звуков для нескольких классов английских букв
00
Вопрос или проблема Я записал аудиофайлы для английских букв, каждый файл включает 26 букв. Я разделил каждую букву на отдельный аудиофайл. Теперь я хочу поместить подобные аудиобуквы в одну папку. Я могу сделать это вручную, но это займет время.
Data Science
Улучшение качества данных как часть предобработки: Импутация
00
Вопрос или проблема У меня есть DataFrame pandas на Python, представляющий супerset. Данные содержат много пропусков, которые я хочу заменить реальными значениями. Супerset имеет: как числовые, так и категориальные данные некоторые пропуски для большинства
Data Science
Кривые обучения
01
Вопрос или проблема Я работаю над задачей многоклассовой классификации. Я хочу узнать, переобучается ли моя модель или недообучается. Я изучаю, как строить кривые обучения, и у меня есть 4 вопроса. 1.) Правильно ли я упорядочил шаги, как я сделал ниже, т.
Data Science
Плохое качество работы для двух классов в многоклассовой классификации.
00
Вопрос или проблема У меня есть многоклассовая классификация с 5 классами (табличные данные), я использовал модель xgboost, модель хорошо работает для 3 классов, но плохо для оставшихся классов (2 класса). Я пробовал увеличение выборки и веса классов
Data Science
Как объяснить относительную разницу между макро-AUC и макро-F1 в задаче многоклассовой классификации?
00
Вопрос или проблема На днях я опубликовал статью, в которой результат модели с учителем следующий. Все метрики усредненные по классу. Меня попросили прокомментировать разницу между AUC и другими метриками, в частности F1. Быстро это относительно сбалансированная задача.