oversampling
Data Science
Вопрос или проблема Заголовок. У меня есть набор данных, который сильно несбалансирован, скажем, выходная переменная, которую я хочу предсказать, ограничена диапазоном от 0 до 1, но почти все точки данных находятся в диапазоне от 0,7 до 0,9, тогда как
Data Science
Вопрос или проблема У меня уже есть 2 набора данных. Один для обучения и один для тестирования. Оба набора данных несбалансированы (с похожими процентами), с около 90% метки 1. Будет ли полезно сбалансировать данные, если тестовый набор в любом случае очень несбалансирован?
Data Science
Вопрос или проблема Я работаю с несбалансированным набором данных для предсказания инсультов, где положительный класс (возникновение инсульта) значительно недопредставлен. Сначала я использовал логистическую регрессию, но из-за несбалансированности классов
Data Science
Вопрос или проблема У меня есть неориентированный взвешенный граф, где веса ребер представляют собой вероятности. Большинство весов ребер равны 1 (они встречаются в 7 раз чаще, чем вторая по величине группа весов). Я использую этот граф для обучения векторного
Data Science
Вопрос или проблема Я пытаюсь решить проблему с несбалансированным набором данных. У меня есть два класса, один для пациентов с риском (1), другой для пациентов без риска (0). У меня больше пациентов без риска. Для анализа я использовал такие методы