logistic-regression - ответы на вопросы - Page 2 of 3

Data Science

Поиск логистической потери/отрицательного логарифмического правдоподобия – классификация бинарной логистической регрессией

00

Вопрос или проблема Я новичок в машинном обучении и науке о данных, и у меня возникают трудности с простой задачей. В моей задаче мне дана серия данных $X_i$, где $X_i = (x_{i1}, x_{i2})$, и у каждой точки данных есть метка $y_i$, где $y_i \in [-1, 1]$.

Data Science

Логистическая регрессия для прогнозирования

01

Вопрос или проблема Я хотел бы спросить о теоретическом подходе к использованию логистической регрессии для данных клиентов и, более конкретно, для прогнозирования оттока (в BigQuery и Python). У меня есть данные о клиентах для интернет-магазина, и я

Data Science

Эффект логарифмических шансов на искаженные данные

00

Вопрос или проблема Приведение логарифма шансов устанавливает линейность между шансами зависимой переменной и независимыми переменными, устраняя асимметрию в данных? Является ли это одной из причин, по которой мы используем логарифм шансов в логистической регрессии?

Data Science

Кросс-эластичность спроса с логистической регрессией

00

Вопрос или проблема Первый пост, будьте добры 😁 Я пытаюсь рассчитать кросс-эластичность спроса. Основная экономическая концепция проста, но при попытке реализовать её я вижу множество различных методов/равнений, которые дают разные результаты.

Data Science

Могу ли я использовать кластеризацию после классификации для улучшения производительности моего классификатора?

00

Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью

Data Science

Влияние нескольких неправильно масштабированных значений признаков на модель логистической регрессии

00

Вопрос или проблема Мне была предложена ситуация, чтобы предсказать действительность модели логистической регрессии, когда было обнаружено, что определенные значения высоко взвешенной переменной были ошибочно умножены на 1000.

Data Science

Интерпретация логарифмических шансов в случае нескольких предсказательных переменных

00

Вопрос или проблема Интерпретация логарифмических шансов с одной переменной предсказания –> 0.8=2.5(Гипертензия) Шансы человека с гипертензией заболеть сердечными заболеваниями составляют 0.8. Логарифмические шансы с несколькими переменными предсказания –

Data Science

Почему потери MSE и кросс-энтропии имеют одинаковый градиент?

00

Вопрос или проблема Я студент по специальности анализ данных, и когда я учился выводить функцию потерь логистической регрессии (потери кросс-энтропии), я обнаружил, что градиент совершенно идентичен градиенту методом наименьших квадратов для линейной

Data Science

Анализ классификации текста на основе сходства

00

Вопрос или проблема Я прочитал много литературы по классификации текстов и различным подходам/моделям, особенно с использованием языка Python, но, вероятно, я все еще не понимаю, как построить модели и какие шаги для этого нужны.

Data Science

Логистическая регрессия для категориальных признаков с несколькими значениями в каждой категории

00

Вопрос или проблема Я работаю над случаем использования страхования, чтобы построить классификатор логистической регрессии для прогнозирования, истечет ли полис или нет. Набор данных содержит более 20 категориальных признаков для полиса.

Вопросы и ответы

R GAMLSS : Как подогнать логарифмически-логистическое распределение (усеченное)?

00

Вопрос или проблема Я пытаюсь подогнать усеченное логистическое распределение (log-logistic) с помощью GAMLSS и не могу найти, как это сделать. В документации сказано, что для обобщенной бета-распределения 2 (GB2): установка ν = 1 и τ = 1 в (15.

Data Science

Логарифмические шансы против логарифмической вероятности

00

Вопрос или проблема Логарифмические шансы имеют линейную зависимость с независимыми переменными, поэтому логарифмические шансы равны линейному уравнению. Что насчет логарифма вероятности? Как он связан с независимыми переменными?

Data Science

Переобучение на валидационном наборе данных

00

Вопрос или проблема Я работаю над проектом в области машинного обучения, в котором у меня есть два набора данных: X (признаки индивидуумов) и y (двоичные прогнозы: -1 или 1). Моя цель – предсказать y на основе признаков в X.

Data Science

Избыточная функция после кодирования с одним горячим (one hot encoding)

00

Вопрос или проблема У меня есть числовая переменная, называемая $x$, и категориальная переменная, называемая $y$. $y$ является порядковой переменной (A,B,C,D,E,F). Я использую кодирование меток для своей переменной $y$, и когда я смотрю на корреляцию

Data Science

Подходит ли набор данных для линейной и логистической регрессии?

00

Вопрос или проблема Я работаю с набором данных о качестве красного вина по этой ссылке. Я пытаюсь проверить корреляцию с помощью точечной диаграммы, но, похоже, она не является линейной. Я применил этапы предобработки ниже: Стандартизатор, так как диапазон

Data Science

Понимание интуиции, лежащей в основе сигмоидной кривой в контексте обратного распространения.

00

Вопрос или проблема Я пытался понять значимость S-образной формы сигмоидной/логистической функции. Наклон/производная сигмоиды приближается к нулю для очень больших и очень маленьких значений входных данных. То есть $σ'(z) ≈ 0$ для $z >

Data Science

Как использовать Word2Vec CBOW в статистическом алгоритме?

00

Вопрос или проблема Я видел несколько примеров использования CBOW в моделях нейронных сетей (хотя я их не понял). Я знаю, что Word2Vec не похож на BOW или TFIDF, так как для CBOW нет единственного значения, и все примеры, которые я видел, использовали нейронные сети.

Data Science

Почему у SVM хуже граница разделения, чем у логистической регрессии?

00

Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.

Data Science

Почему значение моего предсказателя (непрерывное) идеально коррелирует с моим логит-значением (при проверке предположений модели логистической регрессии)?

00

Вопрос или проблема Вопрос: Почему мое значение предиктора (непрерывное) идеально коррелирует с моим логитным значением (при тестировании предположений модели логистической регрессии)? Код: # линейность в логите для непрерывной переменной: проверьте линейную

Data Science

Доброта на тестовом или обучающем наборе?

00

Вопрос или проблема Я разделил свой набор данных на обучающую (80%) и тестовую (20%) выборки. Обучил модель логистической регрессии на обучающем наборе. Теперь хочу проверить адекватность модели с помощью хи-квадрат теста на согласие, на каком наборе