Data Science
агрегация важности признаков
00
Вопрос или проблема У меня есть более концептуальный вопрос, по которому я надеюсь получить обратную связь. Я пытаюсь запустить модель машинного обучения с бустингом для выявления подмножества важных предикторов для некоторого клинического состояния.
Data Science
Имеет ли смысл использовать важности признаков, основанные на индексе Джини, для других классификаторов?
00
Вопрос или проблема Мне хотелось бы узнать, имеет ли смысл запускать yellowbrick.features.FeatureImportances с моделью RandomForestClassifier, чтобы найти наиболее влиятельные признаки, а затем подгонять другую модель (например, MLPClassifier) с этими признаками.
Data Science
Взаимодействия признаков против Важности признаков
00
Вопрос или проблема В чем различия между Взаимодействиями признаков и Важностью признаков? Моя точка зрения: Важность признака: Как признак способствовал предсказанию? Это будет коэффициент, если это линейная регрессия с IID данными.
Data Science
Как интерпретировать важность модели случайного леса, среднее уменьшение точности и среднее уменьшение Джини?
00
Вопрос или проблема Модель случайного леса выводит следующие значения важности. Как мне их интерпретировать для выбора признаков? Если это среднее снижение точности, означает ли это, что удаление этих признаков из модели должно увеличить точность?