Data Science
Вопрос о бутстреп-выборке
00
Вопрос или проблема У меня есть корпус вручную аннотированных (так называемый “золотой стандарт”) документов и коллекция аннотаций систем обработки естественного языка (NLP) на тексте из корпуса. Я хочу провести выборку систем и золотого стандарта
Data Science
Вложенная кросс-валидация и доверительные интервалы
00
Вопрос или проблема Надеюсь, кто-то сможет мне помочь разобраться с этим. Я наткнулся на множество различных ресурсов о вложенной кросс-валидации, но, похоже, я запутался в том, как выбрать модель и правильно построить доверительные интервалы для процесса обучения.
Data Science
Список образцов, на которых обучается каждое дерево в случайном лесу в Scikit-Learn
00
Вопрос или проблема В случайном лесу Scikit-learn вы можете установить bootstrap=True, и каждое дерево выберет подмножество образцов для обучения. Есть ли способ увидеть, какие образцы используются в каждом дереве? Я ознакомился с документацией о деревьях-оценках