Data Science
Интерпретация логарифмических шансов в случае нескольких предсказательных переменных
00
Вопрос или проблема Интерпретация логарифмических шансов с одной переменной предсказания –> 0.8=2.5(Гипертензия) Шансы человека с гипертензией заболеть сердечными заболеваниями составляют 0.8. Логарифмические шансы с несколькими переменными предсказания –
Data Science
Почему потери MSE и кросс-энтропии имеют одинаковый градиент?
00
Вопрос или проблема Я студент по специальности анализ данных, и когда я учился выводить функцию потерь логистической регрессии (потери кросс-энтропии), я обнаружил, что градиент совершенно идентичен градиенту методом наименьших квадратов для линейной
Data Science
Анализ классификации текста на основе сходства
00
Вопрос или проблема Я прочитал много литературы по классификации текстов и различным подходам/моделям, особенно с использованием языка Python, но, вероятно, я все еще не понимаю, как построить модели и какие шаги для этого нужны.
Data Science
Логистическая регрессия для категориальных признаков с несколькими значениями в каждой категории
00
Вопрос или проблема Я работаю над случаем использования страхования, чтобы построить классификатор логистической регрессии для прогнозирования, истечет ли полис или нет. Набор данных содержит более 20 категориальных признаков для полиса.
Вопросы и ответы
R GAMLSS : Как подогнать логарифмически-логистическое распределение (усеченное)?
00
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Data Science
Логарифмические шансы против логарифмической вероятности
00
Вопрос или проблема Логарифмические шансы имеют линейную зависимость с независимыми переменными, поэтому логарифмические шансы равны линейному уравнению. Что насчет логарифма вероятности? Как он связан с независимыми переменными?
Data Science
Переобучение на валидационном наборе данных
00
Вопрос или проблема Я работаю над проектом в области машинного обучения, в котором у меня есть два набора данных: X (признаки индивидуумов) и y (двоичные прогнозы: -1 или 1). Моя цель – предсказать y на основе признаков в X.
Data Science
Избыточная функция после кодирования с одним горячим (one hot encoding)
00
Вопрос или проблема У меня есть числовая переменная, называемая $x$, и категориальная переменная, называемая $y$. $y$ является порядковой переменной (A,B,C,D,E,F). Я использую кодирование меток для своей переменной $y$, и когда я смотрю на корреляцию
Data Science
Подходит ли набор данных для линейной и логистической регрессии?
00
Вопрос или проблема Я работаю с набором данных о качестве красного вина по этой ссылке. Я пытаюсь проверить корреляцию с помощью точечной диаграммы, но, похоже, она не является линейной. Я применил этапы предобработки ниже: Стандартизатор, так как диапазон
Data Science
Понимание интуиции, лежащей в основе сигмоидной кривой в контексте обратного распространения.
00
Вопрос или проблема Я пытался понять значимость S-образной формы сигмоидной/логистической функции. Наклон/производная сигмоиды приближается к нулю для очень больших и очень маленьких значений входных данных. То есть $σ'(z) ≈ 0$ для $z >
Data Science
Как использовать Word2Vec CBOW в статистическом алгоритме?
00
Вопрос или проблема Я видел несколько примеров использования CBOW в моделях нейронных сетей (хотя я их не понял). Я знаю, что Word2Vec не похож на BOW или TFIDF, так как для CBOW нет единственного значения, и все примеры, которые я видел, использовали нейронные сети.
Data Science
Почему у SVM хуже граница разделения, чем у логистической регрессии?
00
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Почему значение моего предсказателя (непрерывное) идеально коррелирует с моим логит-значением (при проверке предположений модели логистической регрессии)?
00
Вопрос или проблема Вопрос: Почему мое значение предиктора (непрерывное) идеально коррелирует с моим логитным значением (при тестировании предположений модели логистической регрессии)? Код: # линейность в логите для непрерывной переменной: проверьте линейную
Data Science
Доброта на тестовом или обучающем наборе?
00
Вопрос или проблема Я разделил свой набор данных на обучающую (80%) и тестовую (20%) выборки. Обучил модель логистической регрессии на обучающем наборе. Теперь хочу проверить адекватность модели с помощью хи-квадрат теста на согласие, на каком наборе
Data Science
Наказывает ли hinge loss за ошибки классификации за пределами границы меньше, чем logistic loss?
00
Вопрос или проблема Это вопрос с несколькими вариантами ответа, который я нашёл Потеря хинг (hinge loss), используемая в SVM, обычно даёт меньшее значение, чем логистическая регрессия, для точек, которые классифицируются неправильно с высокой вероятностью или оценкой.
Data Science
Биномиальная семья в логистической регрессии
00
Вопрос или проблема Меня спросили на интервью, почему мы используем биномиальное распределение в логистической регрессии и как это связано с классом, который мы предсказываем? Может кто-то объяснить, без каких-либо математических уравнений, почему мы
Data Science
Возможно ли применение логистической регрессии с использованием удобной выборки?
00
Вопрос или проблема Я собрал данные опроса бездомных людей, изучая их употребление наркотиков, уровень образования, возраст, пол и т.д. Я надеюсь провести логистическую регрессию, чтобы узнать, насколько бездомность (+ другие зависимые переменные) влияет
Data Science
Ядро завершается или процесс зависает при выполнении предсказания LR на датафрейме с использованием apply.
00
Вопрос или проблема Я пытаюсь сделать предсказания с помощью простой модели. model=LogisticRegression() model.fit(X_train,y_train) После подгонки я пытаюсь сделать предсказания. Пример значения X_test и код ниже. X_train[41626] array([-0.
Data Science
Производная пользовательской функции потерь с логистической функцией
00
Вопрос или проблема У меня есть функция потерь с $\mu ,p, o, u, v$ в качестве переменных, а $\sigma$ является логистической функцией. Мне нужно вывести эту функцию потерь. Из-за множества переменных в функции потерь мне нужно использовать функцию softmax
Data Science
Как заставить логистическую регрессию придавать некоторым наблюдениям большее значение/вес?
00
Вопрос или проблема У меня есть задача бинарной классификации с набором данных, состоящим из нескольких признаков. Когда я обучаю LogisticRegression на этом наборе данных, я получаю большое количество ложноположительных и ложноотрицательных результатов.