Data Science
XGBoost выводит деревья за пределами n_estimator
00
Вопрос или проблема У меня есть модель XGBoost с следующими параметрами xgbc_final = XGBClassifier(objective="multi:softprob", num_class = 2,max_depth = 60, n_estimators = 512, reg_lambda = 0.1214, alpha = 0.9131, gamma = 0, colsample_bytree = 0.
Data Science
Разделитель в деревьях решений в реализации sklearn
00
Вопрос или проблема Я очень запутался в том, как деревья решений выбирают признаки и пороговые значения для разбиения. Я полностью понимаю различные метрики разбиения (индекс Джини и так далее), используемые и то, как они работают.
Data Science
Реально ли использовать алгоритмы деревьев решений для обнаружения ошибок сенсоров?
00
Вопрос или проблема Суть в том, что я хочу отделить системные ошибки от ошибок сенсоров, используя некоторый набор данных из беспроводной сенсорной сети с помощью алгоритма машинного обучения. Например, если у меня есть несколько температурных сенсоров
Data Science
У меня 100% точность на тестовом наборе, неужели что-то не так?
00
Вопрос или проблема Я получил 100% точности на своем тестовом наборе, используя алгоритм дерева решений, но только 85% точности с использованием случайного леса. Есть ли что-то не так с моей моделью или дерево решений наиболее подходит для предоставленного набора данных?
Data Science
Сравнимо ли регрессионное дерево решений с локально взвешенной регрессией?
00
Вопрос или проблема Я новичок в методе деревьев решений. Для модели регрессии деревьев решений, она просто подстраивает кусочную ступенчатую функцию под данные? Когда и почему люди предпочитают её по сравнению с традиционной регрессией, такой как регрессия
Data Science
Насколько важен поиск с предвосхищением в деревьях решений?
00
Вопрос или проблема Я использую случайные леса, и в моих данных существует много ситуаций, когда $X_1$ является плохим предиктором, $X_2$ является плохим предиктором, но совместное распределение может быть хорошим предиктором.
Data Science
Лучшие методы стратификации данных на 4 группы (несупервизорным способом) с использованием набора/комбинации переменных.
00
Вопрос или проблема Я пытаюсь стратифицировать группу пациентов по возможным молекулярным подтипам рака. Я понимаю, что у всех этих пациентов есть рак, но целью является (вне зависимости от обучения) кластеризовать их на 4 возможных подтипа.