linear-regression
Data Science
Вопрос или проблема В Scikit learn есть генератор данных make_regression. Можете кто-нибудь объяснить мне, как будто мне 5 лет, что имеется в виду в документации под “Набор входных данных может быть хорошо обусловленным (по умолчанию) или иметь
Data Science
Вопрос или проблема Я впервые работаю с датами. Сначала я знал, что мне нужно преобразовать их в временные метки, что дало мне значения в формате “datetime64”. Но потом я узнал, что линейная регрессия из sklearn не принимает datetime как тип данных для регрессии.
Data Science
Вопрос или проблема Я работал с набором данных, который содержит данные известной компании по поставкам наркотиков. Первые несколько записей в наборе данных выглядят следующим образом; Другие данные сопутствуют этому (основному) набору данных.
Data Science
Вопрос или проблема Я следил за этим вопросом. Случай 1: У меня задача: обучаться на протяжении трех последовательных дней, чтобы предсказать каждый четвертый день. Данные каждого дня представляют собой один CSV файл, который имеет размеры 24×
Data Science
Вопрос или проблема Я новичок в машинном обучении и в данный момент занимаюсь практикой, работая с наборами данных, которые нахожу на Kaggle. В настоящее время я пытаюсь предсказать цену Audi на основе модели, пробега и года выпуска, используя немного
Data Science
Вопрос или проблема Период действия вознаграждения истекает через 7 дней. Ответы на этот вопрос имеют право на +150 репутационного вознаграждения. С. М. ищет канонический ответ. Случай 1: У меня есть следующая задача: Обучение на протяжении 3 последовательных
Data Science
Вопрос или проблема Этот вопрос касается вопроса 4h из этого учебного задания. Вопрос заключается в том, чтобы сделать прогнозы на будущее на основе выбранной модели TSLM, которая включает эндогенно созданную (если я использую это правильно) дummies-переменную
Data Science
Вопрос или проблема У меня есть следующая задача: Обучение по последовательным 3 дням для предсказания 4-го дня. Каждый день данных представляет собой один CSV файл, который имеет размеры 24×25. Каждая точка данных в каждом CSV файле является пикселем.
Data Science
Вопрос или проблема У меня есть следующая задача: тренировочная программа на протяжении 3 дней для прогнозирования 4-го дня. Каждодневные данные представлены в виде одного CSV файла с размерами 24×25. Каждая точка данных в каждом CSV файле соответствует пикселю.
Data Science
Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).
Data Science
Вопрос или проблема Я довольно нов в МЛ и начинал с линейной регрессии, сочетая её с градиентным спуском. Вот уравнение, к которому я пытался прийти, используя JavaScript – А вот что у меня получилось на JS – function algorithmify(){ let sumHDiff=hypotheses();
Data Science
Вопрос или проблема Проверяю в этом сообществе, может кто-то сможет помочь с этой проблемой, опубликованной на Cross Validated. Подробный вопрос представлен ниже: Результаты OLS регрессии ===============================================================================
Data Science
Вопрос или проблема class LR: def __init__(self, x, y): self.x = x self.y = y self.xmean = np.mean(x) self.ymean = np.mean(y) self.x_xmean = self.x - self.xmean self.y_ymean = self.y - self.ymean self.covariance = sum(self.x_xmean * self.
Data Science
Вопрос или проблема Мне удалось построить несколько моделей линейной регрессии, которые могут достаточно хорошо прогнозировать прочность материала: минимальное RMSE составляет 17.95 с использованием 11 признаков, которые я выбрал из 159 оригинальных признаков.
Data Science
Вопрос или проблема Я работаю с набором данных о качестве красного вина по этой ссылке. Я пытаюсь проверить корреляцию с помощью точечной диаграммы, но, похоже, она не является линейной. Я применил этапы предобработки ниже: Стандартизатор, так как диапазон
Data Science
Вопрос или проблема def predict(self, input): return (self.slope*input) + self.bias def train(self,inputs,targets): N = len(inputs) predictions = np.array([self.predict(input) for input in inputs]) errors = np.array(targets)-predictions self.
Data Science
Вопрос или проблема Я читаю ESL и наткнулся на это уравнение (3.6), где дисперсия оценок параметров представлена как $$Var(\hat{\beta}) = (X^TX)^{-1}{\sigma}^2$$ Я понимаю математику, с помощью которой получается это уравнение, но я пытаюсь понять, что
Вопросы и ответы
Вопрос или проблема Хорошо, этот вопрос может быть немного сложным, поэтому позвольте мне объяснить свою ситуацию как можно лучше. У меня есть датафрейм, аналогичный приведенному ниже примеру, в котором есть предсказательная колонка (xpred) и три ответные колонки (y1:y3).
Data Science
Вопрос или проблема У меня есть одна папка, в которой содержится много файлов CSV, размеры которых составляют 24×25. Каждый файл CSV представляет собой данные за один день. Я выполняю следующую задачу: Случай 1: Рассмотрим следующий наивный классификатор
Data Science
Вопрос или проблема У меня есть набор данных по избирательным участкам и результатам партий на различных выборах. После прочтения этой статьи мне очень захотелось использовать линейную регрессию, чтобы ответить на вопрос: как изменилось мнение избирателей с последних выборов?