Data Science
Обеспечьте сбалансированные батчи классов при настройке гиперпараметров моделей keras с помощью перебора по сетке.
00
Вопрос или проблема Обеспечение сбалансированных классов в пакетах во время обучения моделей keras возможно с использованием метода fit_generator. Я использовал imblearn.keras.BalancedBatchGenerator для этого, и это работает хорошо!
Data Science
CNN для подмножеств набора данных – как настраивать гиперпараметры
00
Вопрос или проблема У меня есть набор данных, и я хотел бы обучить сверточные нейронные сети (CNN) на подмножествах разного размера этого набора данных. У меня уже есть CNN, который очень хорошо классифицирует, если я использую весь набор данных.
Data Science
Ошибка назначения конфигурации Hyperas LSTM
00
Вопрос или проблема Я работал над своей тривиальной моделью LSTM на Keras, пытаясь реализовать Hyperas с помощью следующего кода, который вызывает ошибку, которую я не могу разрешить. Я просто экспериментировал с Hyperas, и было бы здорово заставить это работать.
Data Science
настройка гиперпараметров с использованием валидационного набора
00
Вопрос или проблема Насколько я знаю, и поправьте меня, если я не прав, использование кросс-валидации для настройки гиперпараметров нецелесообразно, когда у меня есть огромный набор данных. В таком случае лучше разделить данные на обучающий, валидационный и тестовый наборы;
Data Science
Выбор признаков или настройка гиперпараметров сначала для данных с 30 признаками
00
Вопрос или проблема У меня примерно 30 переменных, и я пытаюсь создать модель случайного леса. Все переменные предполагаются предикторами исхода. Я хочу найти лучшую модель на основе C-статистики с любым количеством признаков.
Data Science
реализовать кластер dask с prophet
00
Вопрос или проблема Я пытаюсь реализовать dask. В данный момент я использую joblib, и он работает отлично, использует весь ЦП, что, на мой взгляд, идеально, но я хочу добавить больше ресурсов. Теперь, пытаясь реализовать dask, это идет гораздо медленнее
Data Science
Кросс-валидация и разбиение на обучающую и тестовую выборки
00
Вопрос или проблема Я создаю класс, который следует следующему рабочему процессу: Выбор модели и подгонка Класс принимает список моделей и соответствующие им сетки гиперпараметров. Затем он выполняет стандартный процесс подгонки для каждой модели, используя
Data Science
Настройка веса потерь в дистилляции знаний
00
Вопрос или проблема Я реализую модель дистилляции знаний. Однако баланс и соотношение между разными компонентами потерь сильно влияют на дистилляцию знаний. Есть ли какие-то хорошие практики для нахождения оптимальных весов потерь и существуют ли соответствующие
Data Science
Оптимизация обрезки во время кросс-валидции, имеет ли это смысл?
00
Вопрос или проблема В настоящее время я пытаюсь построить модель с использованием CatBoost. Для настройки параметров я использую optuna и кросс-валидацию, а также подрезаю испытания, проверяя промежуточные оценки кросс-валидации.
Data Science
Параметры для настройки MLP классификатора с помощью Gridsearch CV?
00
Вопрос или проблема Я хочу настроить параметры классификатора MLP из sklearn, но не знаю, какие из них настраивать и сколько вариантов предложить? Например, это скорость обучения. Должен ли я указать значения [.0001, .001, .01, .1, .2, .3]?
Data Science
Вопрос о грид-поиске и KFold
00
Вопрос или проблема Я пробую пример, над которым я тренируюсь на огромном наборе данных в 5 миллионов (только 4 признака) строк с помощью Cudf и CUml, и я использую SGD логистическую регрессию, потому что я должен предсказать, болен ли пациент или нет.
Data Science
Преимущества использования инструментов оптимизации гиперпараметров, специфичных для глубокого обучения, по сравнению с sklearn.
00
Вопрос или проблема Существует довольно много библиотек для оптимизации гиперпараметров, которые специфичны для Keras или других библиотек глубокого обучения, таких как Hyperas или Talos. Мой вопрос: в чем основное преимущество использования этих библиотек
Data Science
Подход Train/val/test для настройки гиперпараметров
00
Вопрос или проблема Когда вы планируете обучать модель, имеет ли смысл разделение данных на 60-20-20 для обучения, валидации и тестирования, сначала настраивая гиперпараметры на обучающем наборе данных, используя валидационный набор, и выбирая лучшую модель.