hyperparameter-tuning - ответы на вопросы

Data Science

Какие гиперпараметры для стандартной LLM предоставляют наибольшую пользу по сравнению с затратами на производительность?

00

Вопрос или проблема У GPT-3 есть несколько гиперпараметров, определяющих архитектуру сети. Мой вопрос: какие из этих гиперпараметров, при увеличении, дают наибольшую выгоду в производительности по сравнению с вычислительной стоимостью?

Data Science

Какие гиперпараметры возвращаются как лучшие при кросс-валидации?

00

Вопрос или проблема Описание в RandomizedSearchCV говорит следующее о лучших гиперпараметрах: “Оценщик, выбранный в ходе поиска, то есть оценщик, который дал наивысший балл (или наименьшую потерю, если это указано) на отложенных данных. Недоступен, если refit=False.”

Data Science

Выбор количества признаков с помощью перекрестной проверки

00

Вопрос или проблема У меня есть алгоритм, который обучает бинарную предиктивную модель для заданного количества признаков из набора данных (признаки все одного типа, но не все важные). Таким образом, количество признаков является гиперпараметром, который

Data Science

Должен ли я использовать одинаковые гиперпараметры для разных наборов данных в моделях машинного обучения?

00

Вопрос или проблема Я студент и ищу вашей помощи. У меня есть два набора данных, включая КТ-сканирование до лечения и КТ-сканирование после лечения. Я хочу сравнить эти наборы данных, чтобы определить, какой из них показывает наилучшую производительность

Data Science

Почему-то появляется странная ошибка при гипернастройке моей модели.

00

Вопрос или проблема Я надеялся настроить мою модель decisiontree, однако я постоянно сталкиваюсь с этой ошибкой: TypeError: DecisionTreeClassifier() получил неожиданный аргумент ‘criterion’ вот что я попытался сделать: def randomsearch(): data = pd.

Data Science

Валидация после настройки гиперпараметров

00

Вопрос или проблема Я настроил свои гиперпараметры с помощью случайного поиска и использовал cv=5. Важно ли валидировать гиперпараметры с моделью и тестовыми данными, или можно использовать полученную точность от случайного поиска?

Data Science

RFECV и поиск по сетке – какие наборы использовать для настройки гиперпараметров?

00

Вопрос или проблема Я запускаю модели машинного обучения (все с использованием оценщиков из sci-kit learn, без нейронных сетей) на основании пользовательского набора данных с рядом признаков и биномиальным выходом. Я сначала разделяю набор данных на 0.

Data Science

Могу ли я применять разные гиперпараметры для разных временных интервалов скользящего окна?

00

Вопрос или проблема Вопрос Могу ли я применять различные гиперпараметры для разных наборов данных для обучения? Я вижу смысл в использовании общих параметров, но не вижу смысла в использовании общих гиперпараметров. Преимущество использования общих параметров

Data Science

Если min_sample_leaf больше, чем min_sample_split в дереве решений, будет ли это проблемой?

00

Вопрос или проблема Я настраиваю гиперпараметры дерева решений для набора данных из 550 образцов. Так как я относительно новичок в настройке гиперпараметров (я учусь и реализую это), я запутался, какие значения установить для гиперпараметров, таких как

Data Science

Могу ли я напрямую применять методы настройки гиперпараметров и выбрать лучшую модель?

00

Вопрос или проблема Я заметил в некоторых источниках, что автор сначала обучает модель (например, модель из scikit-learn) с параметрами по умолчанию, и модель естественным образом дает результат. Затем они пытаются оптимизировать гиперпараметры, даже

Data Science

Настройка сверточной нейронной сети, размер выборки

00

Вопрос или проблема Я постоянно читаю, что свёрточные нейронные сети (CNN) работают лучше всего с огромным количеством данных (100 тысяч и более). Есть ли какие-либо эмпирические правила или нижний предел для объёма данных на этапе поиска по сетке?

Data Science

Как я могу настроить гиперпараметры LSTM?

00

Вопрос или проблема Если кто-то может ответить на эти вопросы, это будет замечательно. Я нахожусь на этапе выполнения выпускного проекта по LSTM. В данный момент я застрял и запутался в кодах LSTM. Есть 4 гиперпараметра, с которыми я могу поэкспериментировать

Data Science

Имеет ли смысл настройка гиперпараметров для случайных лесов?

00

Вопрос или проблема У меня есть задача бинарной классификации с существенным дисбалансом классов (99% отрицательных – 1% положительных). Я хочу разработать модель случайного леса для предсказаний, и после установления базового уровня (с параметрами

Data Science

Почему настройка гиперпараметров происходит на валидационном наборе данных, а не в самом начале?

00

Вопрос или проблема Несмотря на то, что я использовал его несколько раз, я все еще немного запутан в использовании набора валидации для настройки гиперпараметров. Насколько я могу судить, я выбираю модель, обучаю ее на обучающих данных, оцениваю производительность

Data Science

Обеспечьте сбалансированные батчи классов при настройке гиперпараметров моделей keras с помощью перебора по сетке.

00

Вопрос или проблема Обеспечение сбалансированных классов в пакетах во время обучения моделей keras возможно с использованием метода fit_generator. Я использовал imblearn.keras.BalancedBatchGenerator для этого, и это работает хорошо!

Data Science

CNN для подмножеств набора данных – как настраивать гиперпараметры

00

Вопрос или проблема У меня есть набор данных, и я хотел бы обучить сверточные нейронные сети (CNN) на подмножествах разного размера этого набора данных. У меня уже есть CNN, который очень хорошо классифицирует, если я использую весь набор данных.

Data Science

Ошибка назначения конфигурации Hyperas LSTM

00

Вопрос или проблема Я работал над своей тривиальной моделью LSTM на Keras, пытаясь реализовать Hyperas с помощью следующего кода, который вызывает ошибку, которую я не могу разрешить. Я просто экспериментировал с Hyperas, и было бы здорово заставить это работать.

Data Science

настройка гиперпараметров с использованием валидационного набора

00

Вопрос или проблема Насколько я знаю, и поправьте меня, если я не прав, использование кросс-валидации для настройки гиперпараметров нецелесообразно, когда у меня есть огромный набор данных. В таком случае лучше разделить данные на обучающий, валидационный и тестовый наборы;

Data Science

Выбор признаков или настройка гиперпараметров сначала для данных с 30 признаками

00

Вопрос или проблема У меня примерно 30 переменных, и я пытаюсь создать модель случайного леса. Все переменные предполагаются предикторами исхода. Я хочу найти лучшую модель на основе C-статистики с любым количеством признаков.

Data Science

реализовать кластер dask с prophet

00

Вопрос или проблема Я пытаюсь реализовать dask. В данный момент я использую joblib, и он работает отлично, использует весь ЦП, что, на мой взгляд, идеально, но я хочу добавить больше ресурсов. Теперь, пытаясь реализовать dask, это идет гораздо медленнее