Data Science
Как улучшить производительность модели LSTM для прогнозирования погоды?
00
Вопрос или проблема Я предсказываю осадки, используя observational данные. Всего имеется 87,070 образцов данных, но только 1,885 образцов имеют осадки. Вот LSTM модель, которую я использую: class LstmModel(Model): def __init__(self, Lstm_units) ->
Data Science
Плохое качество работы для двух классов в многоклассовой классификации.
00
Вопрос или проблема У меня есть многоклассовая классификация с 5 классами (табличные данные), я использовал модель xgboost, модель хорошо работает для 3 классов, но плохо для оставшихся классов (2 класса). Я пробовал увеличение выборки и веса классов
Data Science
Есть ли больше в несбалансированной классификации с XGBoost, чем просто перераспределение функции потерь?
00
Вопрос или проблема Я работаю над набором данных для обнаружения мошенничества, который, по естественным причинам, сильно несбалансирован. Мой классификатор – это XGBoost с весами классов. Другими словами, я просто увеличиваю вес положительного
Data Science
несбалансированный целевой набор данных (многоклассовый)
00
Вопрос или проблема У меня есть задача предсказания с многими классами но 300 классов несбалансированы должен ли я сбалансировать все 300 классов, чтобы получить лучший результат? существует ли более простой способ решить эту задачу?
Data Science
Метрика оценки для несбалансированных данных
00
Вопрос или проблема Привет, я аспирант в области компьютерных наук. У меня есть вопрос для экспертов по ИИ или данным. Я пишу статью. Мой набор данных – это временные ряды сенсорных данных, и соотношение аномалий (положительный класс) составляет от 5% до 6%.
Data Science
Как оценить точность на большом наборе данных?
00
Вопрос или проблема Учитывая, что у меня есть модель глубокого обучения (передача от бывшего коллеги). По какой-то причине наборы для обучения и валидации отсутствовали. В моей ситуации я хочу классифицировать свои данные на 100 категорий.
Data Science
Недостаточная/избыточная выборка учит модель неправильному распределению?
00
Вопрос или проблема Суть: Обучение модели с использованием недо/пересемплирования в процессе обучения приведет к неправильному распределению и негативно скажется на точности? Предположим, вы хотите обучить классификатор для различения класса A и класса B.
Data Science
Метрики справедливости в тестовом наборе при неверном распределении
00
Вопрос или проблема У меня есть сомнение, которое мы обсуждаем с моими коллегами уже несколько недель, и я хотел бы узнать ваше мнение. У меня есть модель для диагностики заболевания, и я хочу знать, справедлива ли она. Я обучаю модель на одной когорте
Data Science
С помощью модели регрессии возможно ли точно предсказать “выталкивающие” результаты на основе сильно несбалансированного набора данных?
00
Вопрос или проблема Заголовок. У меня есть набор данных, который сильно несбалансирован, скажем, выходная переменная, которую я хочу предсказать, ограничена диапазоном от 0 до 1, но почти все точки данных находятся в диапазоне от 0,7 до 0,9, тогда как
Data Science
Подходящий алгоритм машинного обучения для моделирования кластеризованного временно изменяющегося бинарного результата
00
Вопрос или проблема Я сразу перейду к делу. У меня есть довольно большой набор данных (100K наблюдений) с непрерывными и категориальными предикторами, которые меняются со временем. Категориальные предикторы, на самом деле, обычно не меняются, однако непрерывные меняются каждый день.
Data Science
Обеспечьте сбалансированные батчи классов при настройке гиперпараметров моделей keras с помощью перебора по сетке.
00
Вопрос или проблема Обеспечение сбалансированных классов в пакетах во время обучения моделей keras возможно с использованием метода fit_generator. Я использовал imblearn.keras.BalancedBatchGenerator для этого, и это работает хорошо!
Data Science
Использование ResNet50 с SE-блоком на несбалансированных данных – pytorch
00
Вопрос или проблема Я работал с набором данных ультразвуковых изображений рака груди, содержащим 432 доброкачественных случаев, 210 злокачественных случаев и 133 нормальных случаев. Сначала я использовал предобученную модель ResNet-50, которая дала следующие
Data Science
Предсказание положительного/отрицательного опыта с очень немногими метками и метками только одного класса
00
Вопрос или проблема У меня есть данные о просмотре видео (длительность сессии, количество видео и т.д.), а также информация о том, нажал ли пользователь кнопку “нравится”. Мы можем использовать кнопку “нравится”
Data Science
Симуляция данных с использованием make_classification в Python
00
Вопрос или проблема У меня есть вопрос о моделировании данных в Python. Я занимаюсь классификацией несбалансированных данных и хочу протестировать эффективность различных методов на смоделированных данных. Я видел в различных статьях и книгах, что функция
Data Science
Нужно ли использовать AUPRC для отчетности о результатах классификации на несбалансированном наборе данных, если модель была обучена с использованием увеличения выборки и кросс-валидации?
00
Вопрос или проблема Я работаю над задачей бинарной классификации, в которой в датасете содержится около 5% положительных классов. Я разделил датасет на 70% для обучения и 30% для тестирования. Я использовал тестовые данные только один раз для оценки производительности модели.
Data Science
Правильный порядок подготовки данных в машинном обучении
00
Вопрос или проблема Для упомянутых ниже шагов подготовки данных Обнаружение/обработка выбросов Импутация данных Масштабирование/стандартизация данных Балансировка классов Есть два под Questions Должны ли каждый из этих шагов выполняться после разделения
Data Science
Несбалансированный класс в моем наборе данных
00
Вопрос или проблема Я работаю с несбалансированным набором данных для предсказания инсультов, где положительный класс (возникновение инсульта) значительно недопредставлен. Сначала я использовал логистическую регрессию, но из-за несбалансированности классов
Data Science
Как взвесить несбалансированные мягкие метки?
00
Вопрос или проблема Цель — это вероятность между N классами, я не хочу, чтобы она предсказывала класс с наивысшей вероятностью, а ‘фактическую’ вероятность для каждого класса. Например: | | Класс 1 | Класс 2 | Класс 3 | ------------------------------------ | 1 | 0.
Data Science
Метки как признаки в детекции аномалий
00
Вопрос или проблема У меня есть набор данных, созданный для решения задачи классификации. Из-за дисбаланса Y я решил перейти к задаче обнаружения аномалий. Должен ли я использовать Y, который у меня есть внутри модели обнаружения аномалий, в качестве признаков?
Data Science
функция потерь с фокусировкой помощь
00
Вопрос или проблема Я работаю над задачей извлечения и классификации отношений. Данные представлены в виде текстовых файлов. Данные несбалансированные. Я хочу использовать функцию потерь focal для решения проблемы несбалансированности классов в данных.