Data Science
Прогнозирование последовательности в наборе данных родитель-ребенок
00
Вопрос или проблема У нас есть большая коллекция документов (D), каждый из которых сопровождается набором метаданных (M). В этой коллекции некоторые документы являются родительскими и имеют несколько дочерних документов. Как родительские, так и дочерние
Data Science
Как классифицировать упорядоченные метки (ординальные данные)?
00
Вопрос или проблема У меня есть данные, похожие на рейтинги фильмов, и метки расположены в порядке, например, от 1 до 10. Поскольку целевая метка не является номинальной, а порядковой переменной, какие типы моделей мне следует использовать для классификации таких данных?
Data Science
Вопрос относительно реализации выбора подмножества OLS
00
Вопрос или проблема На этом сайте я нашел реализацию на Python для выбора набора предикторов в обычной линейной регрессии, включающую Метод Лучшего Подмножества, Прямой Пошаговый Отбор и др. Это должно быть дополнением к книге An Introduction to Statistical
Data Science
Индекс стабильности населения против Индекса точности населения
00
Вопрос или проблема Может ли кто-нибудь объяснить мне разницу между Индексом Стабильности Популяции (PSI) и Индексом Точности Популяции (PAI)? Стабильность популяции относится к тому, изменяется ли распределение объясняющих переменных со временем.
Data Science
Модель предрасположенности только с положительными данными
00
Вопрос или проблема Возможно ли построить модель склонности (т.е. вероятность того, что пользователь купит товар), используя только положительные значения? Например, у меня есть множество данных о Клиентах (людях, которые что-то купили) и Пользователях
Data Science
Нестированная кросс-валидация: ошибка обобщения для нескольких моделей
00
Вопрос или проблема Я имею в виду этот вопрос: Вложенная кросс-валидация и выбор лучшей модели регрессии – является ли это правильным процессом SKLearn? В ответах говорится, что вложенная кросс-валидация может оценивать ошибку обобщения оптимизации