logistic-regression
Data Science
Вопрос или проблема Я пытаюсь изучить логистическую регрессию. Когда я сделал целевую переменную со всеми признаками, у меня был итог, показывающий p-значения, как обычно, но один из признаков имеет 60 уровней, другой признак имеет 13 уровней.
Data Science
Вопрос или проблема Я пытаюсь предсказать вероятность с помощью нейронной сети, но у меня возникают проблемы с тем, чтобы понять, какая функция потерь лучше. Первой мыслью для меня была перекрестная энтропия, но в других ресурсах всегда говорится об этом
Data Science
Вопрос или проблема Я пытаюсь понять детали моделей логистической регрессии и сейчас мне интересно, как создать модель, если у вас есть коэффициенты и перехваты. Я создал модель логистической регрессии на Python и извлек коэффициенты и перехваты.
Data Science
Вопрос или проблема Я пытаюсь самостоятельно реализовать алгоритм логистической регрессии для самообучения, но у меня возникают некоторые проблемы с достижением аналогичной точности, как у логистической регрессии из sklearn. Вот код, который я использую
Data Science
Вопрос или проблема В контексте множественной регрессии меня интересует, есть ли способ разложить $$VIF_i = 1/(1-R_i^2)$$, где $R_i^2$ — это коэффициент детерминации, полученный из регрессии зависимой переменной = i и независимыми переменными, являющимися всеми другими факторами.
Data Science
Вопрос или проблема У меня есть данные о 2000 (например, местоположения, где растут разные фрукты) и 10000 (например, факторы, влияющие на рост фруктов). Я также знаю, что в этих местоположениях имеется 20 различных типов фруктов.
Data Science
Вопрос или проблема У меня есть данные временного ряда о том, как семья тратит деньги на разные продукты. Каждый продукт отнесён к категории (это может быть путь категории из двух уровней), например, (Еда > Курица) или (Личные принадлежности > Макияж).
Data Science
Вопрос или проблема Я работаю над задачей классификации. У меня есть две модели: Модель логистической регрессии Модель случайного леса Для первой модели, если я выберу только предикторы с p-значениями<0.05, я снизлю точность, полноту и т.
Data Science
Вопрос или проблема Мое понимание l2 регуляризации: Весы модели считаются имеющими априорное гауссово распределение, центрированное вокруг 0. Затем оценка MAP по данным добавляет дополнительное наказание в функцию стоимости. Мое сформулированное заявление
Data Science
Вопрос или проблема Я построил модель на наборе данных Титаник с помощью логистической регрессии, и она хорошо предсказывает на обучающем наборе, но, к сожалению, я не могу применить это на тестовом наборе данных. Вот код для справки: training = training[['PassengerId','Sex','Embarked','Pclass','Age','SibSp','Survived']] # 0.