Data Science
Когда мне следует делать разделение на обучающую и тестовую выборки, а также отбор признаков, если мой набор данных несбалансированный?
00
Вопрос или проблема У меня есть набор данных, содержащий ЭКГ-сигналы с 5 различными классами, описывающими качество конкретного окна ЭКГ-сигнала. Мне нужно создать модель машинного обучения для предсказания качества сигнала на основе признаков, извлеченных из каждого окна.
Data Science
Задача многоклассовой классификации с несколькими целями для прогнозирования
00
Вопрос или проблема У нас есть задача классификации с несколькими классами под контролем, где необходимо предсказать две цели для каждого образца: ‘бренд’ и ‘категория’. Наши признаки – ‘shop_name’
Data Science
Оптимизируйте F-оценку только для определенных классов, игнорируя другие классы.
00
Вопрос или проблема У меня есть размеченный набор данных с обзорами продуктов, где метка — это оценка от 1 до 5, а обзор — просто текст. Я использую простой наивный байесовский классификатор (sklearn), чтобы попытаться предсказать оценку, учитывая обзор
Data Science
как обрабатывать задачи классификации с несовместимыми метками?
00
Вопрос или проблема Я работаю над задачей классификации, где экземпляры могут одновременно принадлежать нескольким классам. Например: Фильм может быть отмечен несколькими жанрами, такими как “Экшен”, “Комедия”
Data Science
ROC_AUC значение выше до настройки n_neighbors для KNN.
00
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Согласование многопиковых гистограмм
00
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Является ли это подходящим способом для расчета диаграммы надежности многоклассовой модели для калибровки?
00
Вопрос или проблема Я пытаюсь обобщить диаграммы надежности [1] для многоклассового классификатора и реализовать это с использованием pytorch и pytorch-metrics. Пока все хорошо, но я немного запутан в определении точности и том, как это применимо к пересечению
Data Science
Можно ли заменить категориальные данные на числа в задачах классификации?
00
Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.
Data Science
Адаптация медицинского трансформера для сегментации ран с несколькими классами
00
Вопрос или проблема Я использую Medical Transformer (https://github.com/jeya-maria-jose/Medical-Transformer) для сегментации ран, но хотел бы адаптировать его для сегментации трех различных классов: раны, дополнительный маркер и фон.
Data Science
Модель идентификации говорящих на основе глубокого обучения Keras показывает отличные результаты во время обучения, а затем проваливает предсказания.
00
Вопрос или проблема Я пытаюсь создать модель идентификации говорящего 1:N с использованием Keras и TensorFlow в качестве бэкенда. Я использовал корпус LibriSpeech для обучающих данных и предварительно обработал данные, сначала конвертировав каждый файл из .
Data Science
Обработка очень коротких и очень длинных последовательностей с помощью нейронной сети
00
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.
Data Science
Как вычислить f1_score для многоклассовой многометочной классификации
00
Вопрос или проблема Я использовал одномерное кодирование [1,0,0][0,1,0][0,0,1] для своей функциональной модели классификации. Предсказанные вероятности для тестовых данных yprob = model.predict(testX) дают мне : yprob = array([[0.
Data Science
Метки как признаки в детекции аномалий
00
Вопрос или проблема У меня есть набор данных, созданный для решения задачи классификации. Из-за дисбаланса Y я решил перейти к задаче обнаружения аномалий. Должен ли я использовать Y, который у меня есть внутри модели обнаружения аномалий, в качестве признаков?
Data Science
Как сделать классификаторы 1-против-остальных в библиотеке XGBoost (не Sklearn)?
00
Вопрос или проблема Я работаю с очень большим набором данных, который benefited от продолжения обучения с параметром xgb_model в xgb.train(). Метка (Y) самого набора данных имеет 4 класса и сильно несбалансирована, поэтому я хотел бы сгенерировать PR-кривые
Data Science
функция потерь с фокусировкой помощь
00
Вопрос или проблема Я работаю над задачей извлечения и классификации отношений. Данные представлены в виде текстовых файлов. Данные несбалансированные. Я хочу использовать функцию потерь focal для решения проблемы несбалансированности классов в данных.
Data Science
Основной вопрос о машинном обучении, ищем, с чего начать.
00
Вопрос или проблема Мне порекомендовали опубликовать здесь, а не на StackOverflow Я хочу заняться машинным обучением, и мне просто нужно знать, с чего начать и какой библиотекой/путем пойти. У меня есть два набора данных, которые выглядят примерно так
Data Science
В многоклассовой классификации в SGDClassifier как мне узнать, использует ли он по умолчанию метод один против остальных или один против одного?
00
Вопрос или проблема Согласно книге Geron, для многоклассовой классификации SGDClassifier в scikit-learn использует схему один против остальных. Но как мне узнать, какая схема используется, если эта информация не представлена в справочном файле.
Data Science
Кривая обучения и валидации
00
Вопрос или проблема Я новичок в Deep Learning. Мне не очень хорошо удается понимать и комментировать графики. Можете помочь мне с этими графиками Вопросы, которые я задаю себе, когда вижу графики обучения, следующие: Уменьшается ли потеря и увеличивается ли точность?
Data Science
вычислить метрики sklearn из двумерного массива
00
Вопрос или проблема У меня есть следующий фрейм фактической ценности, [[0.1,0.2,0.3,0.4,0.5], [0.1,0.1,0.3,0.4,0.5], [0.1,0.1,0.3,0.4,0.1], [0.1,0.3,0.3,0.4,0.5], [0.1,0.2,0.2,0.4,0.4], ] И я построил свою модель, которая предсказала значение следующим образом: [[0.
Data Science
Как улучшить мой классификатор?
00
Вопрос или проблема Я обучаю нелинейный классификатор для многослойной задачи классификации. Я подготавливаю обучающие данные в виде отображения пар целых координат (x1, x2) в целое число от нуля до трех. Для каждой пары координат x1/x2 я генерирую 5000