logistic-regression
Data Science
Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью
Data Science
Влияние нескольких неправильно масштабированных значений признаков на модель логистической регрессии
Вопрос или проблема Мне была предложена ситуация, чтобы предсказать действительность модели логистической регрессии, когда было обнаружено, что определенные значения высоко взвешенной переменной были ошибочно умножены на 1000.
Data Science
Вопрос или проблема Интерпретация логарифмических шансов с одной переменной предсказания –> 0.8=2.5(Гипертензия) Шансы человека с гипертензией заболеть сердечными заболеваниями составляют 0.8. Логарифмические шансы с несколькими переменными предсказания –
Data Science
Вопрос или проблема Я студент по специальности анализ данных, и когда я учился выводить функцию потерь логистической регрессии (потери кросс-энтропии), я обнаружил, что градиент совершенно идентичен градиенту методом наименьших квадратов для линейной
Data Science
Вопрос или проблема Я прочитал много литературы по классификации текстов и различным подходам/моделям, особенно с использованием языка Python, но, вероятно, я все еще не понимаю, как построить модели и какие шаги для этого нужны.
Data Science
Вопрос или проблема Я работаю над случаем использования страхования, чтобы построить классификатор логистической регрессии для прогнозирования, истечет ли полис или нет. Набор данных содержит более 20 категориальных признаков для полиса.
Вопросы и ответы
Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.
Data Science
Вопрос или проблема Логарифмические шансы имеют линейную зависимость с независимыми переменными, поэтому логарифмические шансы равны линейному уравнению. Что насчет логарифма вероятности? Как он связан с независимыми переменными?
Data Science
Вопрос или проблема Я работаю над проектом в области машинного обучения, в котором у меня есть два набора данных: X (признаки индивидуумов) и y (двоичные прогнозы: -1 или 1). Моя цель – предсказать y на основе признаков в X.
Data Science
Вопрос или проблема У меня есть числовая переменная, называемая $x$, и категориальная переменная, называемая $y$. $y$ является порядковой переменной (A,B,C,D,E,F). Я использую кодирование меток для своей переменной $y$, и когда я смотрю на корреляцию
Data Science
Вопрос или проблема Я работаю с набором данных о качестве красного вина по этой ссылке. Я пытаюсь проверить корреляцию с помощью точечной диаграммы, но, похоже, она не является линейной. Я применил этапы предобработки ниже: Стандартизатор, так как диапазон
Data Science
Вопрос или проблема Я пытался понять значимость S-образной формы сигмоидной/логистической функции. Наклон/производная сигмоиды приближается к нулю для очень больших и очень маленьких значений входных данных. То есть $σ'(z) ≈ 0$ для $z >
Data Science
Вопрос или проблема Я видел несколько примеров использования CBOW в моделях нейронных сетей (хотя я их не понял). Я знаю, что Word2Vec не похож на BOW или TFIDF, так как для CBOW нет единственного значения, и все примеры, которые я видел, использовали нейронные сети.
Data Science
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Вопрос или проблема Вопрос: Почему мое значение предиктора (непрерывное) идеально коррелирует с моим логитным значением (при тестировании предположений модели логистической регрессии)? Код: # линейность в логите для непрерывной переменной: проверьте линейную
Data Science
Вопрос или проблема Я разделил свой набор данных на обучающую (80%) и тестовую (20%) выборки. Обучил модель логистической регрессии на обучающем наборе. Теперь хочу проверить адекватность модели с помощью хи-квадрат теста на согласие, на каком наборе
Data Science
Вопрос или проблема Это вопрос с несколькими вариантами ответа, который я нашёл Потеря хинг (hinge loss), используемая в SVM, обычно даёт меньшее значение, чем логистическая регрессия, для точек, которые классифицируются неправильно с высокой вероятностью или оценкой.
Data Science
Вопрос или проблема Меня спросили на интервью, почему мы используем биномиальное распределение в логистической регрессии и как это связано с классом, который мы предсказываем? Может кто-то объяснить, без каких-либо математических уравнений, почему мы
Data Science
Вопрос или проблема Я собрал данные опроса бездомных людей, изучая их употребление наркотиков, уровень образования, возраст, пол и т.д. Я надеюсь провести логистическую регрессию, чтобы узнать, насколько бездомность (+ другие зависимые переменные) влияет
Data Science
Вопрос или проблема Я пытаюсь сделать предсказания с помощью простой модели. model=LogisticRegression() model.fit(X_train,y_train) После подгонки я пытаюсь сделать предсказания. Пример значения X_test и код ниже. X_train[41626] array([-0.