hyperparameter-tuning
Data Science
Вопрос или проблема У GPT-3 есть несколько гиперпараметров, определяющих архитектуру сети. Мой вопрос: какие из этих гиперпараметров, при увеличении, дают наибольшую выгоду в производительности по сравнению с вычислительной стоимостью?
Data Science
Вопрос или проблема Описание в RandomizedSearchCV говорит следующее о лучших гиперпараметрах: “Оценщик, выбранный в ходе поиска, то есть оценщик, который дал наивысший балл (или наименьшую потерю, если это указано) на отложенных данных. Недоступен, если refit=False.”
Data Science
Вопрос или проблема У меня есть алгоритм, который обучает бинарную предиктивную модель для заданного количества признаков из набора данных (признаки все одного типа, но не все важные). Таким образом, количество признаков является гиперпараметром, который
Data Science
Вопрос или проблема Я студент и ищу вашей помощи. У меня есть два набора данных, включая КТ-сканирование до лечения и КТ-сканирование после лечения. Я хочу сравнить эти наборы данных, чтобы определить, какой из них показывает наилучшую производительность
Data Science
Вопрос или проблема Я надеялся настроить мою модель decisiontree, однако я постоянно сталкиваюсь с этой ошибкой: TypeError: DecisionTreeClassifier() получил неожиданный аргумент ‘criterion’ вот что я попытался сделать: def randomsearch(): data = pd.
Data Science
Вопрос или проблема Я настроил свои гиперпараметры с помощью случайного поиска и использовал cv=5. Важно ли валидировать гиперпараметры с моделью и тестовыми данными, или можно использовать полученную точность от случайного поиска?
Data Science
Вопрос или проблема Я запускаю модели машинного обучения (все с использованием оценщиков из sci-kit learn, без нейронных сетей) на основании пользовательского набора данных с рядом признаков и биномиальным выходом. Я сначала разделяю набор данных на 0.
Data Science
Вопрос или проблема Вопрос Могу ли я применять различные гиперпараметры для разных наборов данных для обучения? Я вижу смысл в использовании общих параметров, но не вижу смысла в использовании общих гиперпараметров. Преимущество использования общих параметров
Data Science
Вопрос или проблема Я настраиваю гиперпараметры дерева решений для набора данных из 550 образцов. Так как я относительно новичок в настройке гиперпараметров (я учусь и реализую это), я запутался, какие значения установить для гиперпараметров, таких как
Data Science
Вопрос или проблема Я заметил в некоторых источниках, что автор сначала обучает модель (например, модель из scikit-learn) с параметрами по умолчанию, и модель естественным образом дает результат. Затем они пытаются оптимизировать гиперпараметры, даже
Data Science
Вопрос или проблема Я постоянно читаю, что свёрточные нейронные сети (CNN) работают лучше всего с огромным количеством данных (100 тысяч и более). Есть ли какие-либо эмпирические правила или нижний предел для объёма данных на этапе поиска по сетке?
Data Science
Вопрос или проблема Если кто-то может ответить на эти вопросы, это будет замечательно. Я нахожусь на этапе выполнения выпускного проекта по LSTM. В данный момент я застрял и запутался в кодах LSTM. Есть 4 гиперпараметра, с которыми я могу поэкспериментировать
Data Science
Вопрос или проблема У меня есть задача бинарной классификации с существенным дисбалансом классов (99% отрицательных – 1% положительных). Я хочу разработать модель случайного леса для предсказаний, и после установления базового уровня (с параметрами
Data Science
Вопрос или проблема Несмотря на то, что я использовал его несколько раз, я все еще немного запутан в использовании набора валидации для настройки гиперпараметров. Насколько я могу судить, я выбираю модель, обучаю ее на обучающих данных, оцениваю производительность
Data Science
Вопрос или проблема Обеспечение сбалансированных классов в пакетах во время обучения моделей keras возможно с использованием метода fit_generator. Я использовал imblearn.keras.BalancedBatchGenerator для этого, и это работает хорошо!
Data Science
Вопрос или проблема У меня есть набор данных, и я хотел бы обучить сверточные нейронные сети (CNN) на подмножествах разного размера этого набора данных. У меня уже есть CNN, который очень хорошо классифицирует, если я использую весь набор данных.
Data Science
Вопрос или проблема Я работал над своей тривиальной моделью LSTM на Keras, пытаясь реализовать Hyperas с помощью следующего кода, который вызывает ошибку, которую я не могу разрешить. Я просто экспериментировал с Hyperas, и было бы здорово заставить это работать.
Data Science
Вопрос или проблема Насколько я знаю, и поправьте меня, если я не прав, использование кросс-валидации для настройки гиперпараметров нецелесообразно, когда у меня есть огромный набор данных. В таком случае лучше разделить данные на обучающий, валидационный и тестовый наборы;
Data Science
Вопрос или проблема У меня примерно 30 переменных, и я пытаюсь создать модель случайного леса. Все переменные предполагаются предикторами исхода. Я хочу найти лучшую модель на основе C-статистики с любым количеством признаков.
Data Science
Вопрос или проблема Я пытаюсь реализовать dask. В данный момент я использую joblib, и он работает отлично, использует весь ЦП, что, на мой взгляд, идеально, но я хочу добавить больше ресурсов. Теперь, пытаясь реализовать dask, это идет гораздо медленнее