Data Science
Что (в мире) такое хорошо обусловленный против низкозначного многопрофильного сингулярного распределения?
00
Вопрос или проблема В Scikit learn есть генератор данных make_regression. Можете кто-нибудь объяснить мне, как будто мне 5 лет, что имеется в виду в документации под “Набор входных данных может быть хорошо обусловленным (по умолчанию) или иметь
Data Science
Почему мы не можем подать datetime на линейную регрессию и чем toordinal() отличается от любого другого типа данных целого числа?
00
Вопрос или проблема Я впервые работаю с датами. Сначала я знал, что мне нужно преобразовать их в временные метки, что дало мне значения в формате “datetime64”. Но потом я узнал, что линейная регрессия из sklearn не принимает datetime как тип данных для регрессии.
Data Science
Как заполнитьmissing значения в дискретном столбце в прогнозах продаж для компании, занимающейся поставками лекарств.
00
Вопрос или проблема Я работал с набором данных, который содержит данные известной компании по поставкам наркотиков. Первые несколько записей в наборе данных выглядят следующим образом; Другие данные сопутствуют этому (основному) набору данных.
Data Science
регрессионная модель превосходит все модели
00
Вопрос или проблема Я следил за этим вопросом. Случай 1: У меня задача: обучаться на протяжении трех последовательных дней, чтобы предсказать каждый четвертый день. Данные каждого дня представляют собой один CSV файл, который имеет размеры 24×
Data Science
Как предсказать индивидуальное значение после использования линейной регрессии?
00
Вопрос или проблема Я новичок в машинном обучении и в данный момент занимаюсь практикой, работая с наборами данных, которые нахожу на Kaggle. В настоящее время я пытаюсь предсказать цену Audi на основе модели, пробега и года выпуска, используя немного
Data Science
Когда регрессионные модели превосходят наивный метод?
00
Вопрос или проблема Период действия вознаграждения истекает через 7 дней. Ответы на этот вопрос имеют право на +150 репутационного вознаграждения. С. М. ищет канонический ответ. Случай 1: У меня есть следующая задача: Обучение на протяжении 3 последовательных
Data Science
Есть ли способ прогнозировать временной ряд с помощью множественной линейной регрессии, используя экстернально созданные фиктивные переменные?
00
Вопрос или проблема Этот вопрос касается вопроса 4h из этого учебного задания. Вопрос заключается в том, чтобы сделать прогнозы на будущее на основе выбранной модели TSLM, которая включает эндогенно созданную (если я использую это правильно) дummies-переменную
Data Science
Тренировка в течение трех последовательных дней для прогнозирования четвертого дня.
00
Вопрос или проблема У меня есть следующая задача: Обучение по последовательным 3 дням для предсказания 4-го дня. Каждый день данных представляет собой один CSV файл, который имеет размеры 24×25. Каждая точка данных в каждом CSV файле является пикселем.
Data Science
Обучение по многомерным данным
00
Вопрос или проблема У меня есть следующая задача: тренировочная программа на протяжении 3 дней для прогнозирования 4-го дня. Каждодневные данные представлены в виде одного CSV файла с размерами 24×25. Каждая точка данных в каждом CSV файле соответствует пикселю.
Data Science
Мне стоит получить фиктивные переменные, а затем посмотреть на многоколлинеарность?
00
Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).
Data Science
Уравнения линейной регрессии и градиентного спуска
00
Вопрос или проблема Я довольно нов в МЛ и начинал с линейной регрессии, сочетая её с градиентным спуском. Вот уравнение, к которому я пытался прийти, используя JavaScript – А вот что у меня получилось на JS – function algorithmify(){ let sumHDiff=hypotheses();
Data Science
Улучшения Омнибуса и R-квадрата для модели OLS
00
Вопрос или проблема Проверяю в этом сообществе, может кто-то сможет помочь с этой проблемой, опубликованной на Cross Validated. Подробный вопрос представлен ниже: Результаты OLS регрессии ===============================================================================
Data Science
Вычисление коэффициента линейной регрессии
00
Вопрос или проблема class LR: def __init__(self, x, y): self.x = x self.y = y self.xmean = np.mean(x) self.ymean = np.mean(y) self.x_xmean = self.x - self.xmean self.y_ymean = self.y - self.ymean self.covariance = sum(self.x_xmean * self.
Data Science
Почему линейная регрессия не показывает худших результатов при низком весе атрибута?
00
Вопрос или проблема Мне удалось построить несколько моделей линейной регрессии, которые могут достаточно хорошо прогнозировать прочность материала: минимальное RMSE составляет 17.95 с использованием 11 признаков, которые я выбрал из 159 оригинальных признаков.
Data Science
Подходит ли набор данных для линейной и логистической регрессии?
00
Вопрос или проблема Я работаю с набором данных о качестве красного вина по этой ссылке. Я пытаюсь проверить корреляцию с помощью точечной диаграммы, но, похоже, она не является линейной. Я применил этапы предобработки ниже: Стандартизатор, так как диапазон
Data Science
Может кто-то объяснить, что не так с функцией train этой простой модели линейной регрессии?
00
Вопрос или проблема def predict(self, input): return (self.slope*input) + self.bias def train(self,inputs,targets): N = len(inputs) predictions = np.array([self.predict(input) for input in inputs]) errors = np.array(targets)-predictions self.
Data Science
Интерпретация дисперсии оценок параметров в линейной регрессии
00
Вопрос или проблема Я читаю ESL и наткнулся на это уравнение (3.6), где дисперсия оценок параметров представлена как $$Var(\hat{\beta}) = (X^TX)^{-1}{\sigma}^2$$ Я понимаю математику, с помощью которой получается это уравнение, но я пытаюсь понять, что
Вопросы и ответы
Как вычислить множественные линейные модели на основе комбинаций столбцов в датафрейме?
00
Вопрос или проблема Хорошо, этот вопрос может быть немного сложным, поэтому позвольте мне объяснить свою ситуацию как можно лучше. У меня есть датафрейм, аналогичный приведенному ниже примеру, в котором есть предсказательная колонка (xpred) и три ответные колонки (y1:y3).
Data Science
Сравнение между регрессионной моделью
00
Вопрос или проблема У меня есть одна папка, в которой содержится много файлов CSV, размеры которых составляют 24×25. Каждый файл CSV представляет собой данные за один день. Я выполняю следующую задачу: Случай 1: Рассмотрим следующий наивный классификатор
Data Science
Линейная регрессия не возвращает ожидаемое количество $\beta_i$.
00
Вопрос или проблема У меня есть набор данных по избирательным участкам и результатам партий на различных выборах. После прочтения этой статьи мне очень захотелось использовать линейную регрессию, чтобы ответить на вопрос: как изменилось мнение избирателей с последних выборов?