lightgbm
Data Science
Вопрос или проблема Я не совсем уверен в смещении/дисперсии бустированных деревьев решений (особенно LightGBM), поэтому мне интересно, ожидаем ли мы в общем улучшения производительности, создавая ансамбль из нескольких моделей LightGBM, так же как с Random Forest?
Data Science
Вопрос или проблема Я нов в этой области и работаю над простой задачей обнаружения мошенничества с следующим распределением классов: Метка 0: 142,900 образцов Метка 1: 16,530 образцов Я обучаю модель LightGBM, используя Optuna для подбора гиперпараметров.
Data Science
Вопрос или проблема Итак, я в ситуации, когда я знаю, что именно я пытаюсь найти, но не знаю терминологии для этого, и думаю, что именно поэтому многие мои поиски в Google идут не в том направлении, поэтому прошу прощения, если часть этого объяснения окажется избыточной.
Data Science
Вопрос или проблема Я пытался получить работающую модель LightGBM, которую я мог бы обучить на своих данных, выбрать наилучшую модель с наивысшим F1 показателем, а затем использовать ее для получения F1 показателя на тестовых данных.
Data Science
Вопрос или проблема Используя регрессор Light GBM, я обучил свои данные и, используя Grid Search, получил лучшие параметры, но при тестировании с этими параметрами я получаю разные результаты каждый раз, что означает, что модель выдает разные результаты
Data Science
Вопрос или проблема Я пытаюсь вычислить интервалы предсказаний для классификатора, который я обучил в scikit-learn. Даже после установки нового параметра random_state в моем конвейере, это, похоже, не изменяет результаты при повторной подгонке на данных.
Data Science
Вопрос или проблема Я пишу академическую работу по применению методов машинного обучения к прогнозированию временных рядов, и не уверен, как описать теоретическую часть о регуляризованной целевой функции для XGBoost. Ниже вы можете найти уравнение, представленное