Вопросы и ответы
Более эффективный способ передачи данных в AWS Batch Transform Job
00
Вопрос или проблема У меня есть процесс в Sagemaker для обучения и проведения инференса на данных в Sagemaker: Обработка задания: чтение входных CSV файлов из S3 и очистка данных, вывод CSV файлов в S3 Обработка задания: чтение очищенных CSV данных из
Data Science
Оптимизация обрезки во время кросс-валидции, имеет ли это смысл?
00
Вопрос или проблема В настоящее время я пытаюсь построить модель с использованием CatBoost. Для настройки параметров я использую optuna и кросс-валидацию, а также подрезаю испытания, проверяя промежуточные оценки кросс-валидации.
Data Science
Гарантируют ли классовые веса калибровку?
00
Вопрос или проблема Существует возможность назначения весов классов при обучении классификаторов, например, CatBoost. Насколько мне известно, это добавляет вес объектам при вычислении функции потерь, тем самым пенализируя ошибки на них больше или меньше.
Data Science
RandomizedSearchCV(n_iter=10) не останавливается после обучения 10 моделей.
00
Вопрос или проблема Я использую RandomizedSearchCV для оптимизации гиперпараметров. Когда я запускаю модель, она показывает оценки для каждой тренировки модели. Проблема в том, что она обучает гораздо больше 10 моделей, в то время как я ожидаю, что будет
Вопросы и ответы
Невозможно инициализировать Spark CatBoostClassifier с параметрами
00
Вопрос или проблема Я пытаюсь создать CatBoostClassifier, используя catboost_spark. В обычном пакете Catboost такие параметры, как learning_rate, loss_function, num_leaves и т.д., можно включить при создании экземпляра CatBoostClassifier.