class-imbalance
Data Science
Вопрос или проблема У меня есть неориентированный взвешенный граф, где веса ребер представляют собой вероятности. Большинство весов ребер равны 1 (они встречаются в 7 раз чаще, чем вторая по величине группа весов). Я использую этот граф для обучения векторного
Data Science
Вопрос или проблема Как разделить на обучающую и тестовую выборки с помощью train_test_split значений с плавающей запятой? Я использовал LabelEncoder, но у меня около 300К строк, и когда я использовал cross_val, я увидел ValueError: наименьший класс в
Data Science
Вопрос или проблема Предположим, я предсказываю цены на продажу домов (непрерывные значения) и у меня есть несколько независимых переменных (числовых и категориальных). Является ли обычной практикой балансировка набора данных, когда категориальные независимые
Data Science
Вопрос или проблема Я пытаюсь решить задачу классификации с множественными классами, где наблюдается дисбаланс. Для этого я использую SMOTE для оверсемплинга и OSS для недосемплинга. Но у меня есть сомнение, поскольку я работаю с многоклассовой задачей
Data Science
Вопрос или проблема В последнее время я занимаюсь задачей бинарной классификации с несбалансированными данными, где данные упорядочены во времени. Я хотел бы проверить свою модель, используя тренировочные и валидационные разделы с одинаковым соотношением
Data Science
Вопрос или проблема Я создаю нейронную сеть с использованием TensorFlow (v2.9.2) для несбалансированного набора изображений. При этом я заметил, что метод model.compile() имеет аргумент loss_weights, а model.fit() имеет аргумент class_weight.
Data Science
Вопрос или проблема Я пытаюсь решить проблему с несбалансированным набором данных. У меня есть два класса, один для пациентов с риском (1), другой для пациентов без риска (0). У меня больше пациентов без риска. Для анализа я использовал такие методы
Data Science
Вопрос или проблема У меня имеется сильно несбалансированный набор данных (± 5% положительных экземпляров), для которого я обучаю бинарные классификаторы. Я использую вложенную 5-кратную кросс-валидацию с поиском по сетке для настройки гиперпараметров.
Data Science
Вопрос или проблема Здравствуйте, в данный момент я пишу дипломную работу и застрял на некоторых этапах. Я разработал несколько моделей машинного обучения (XGBoost, (сбалансированный) случайный лес, ElasticNet и др.) на крайне несбалансированном наборе