Data Science
Могу ли я использовать процент для определения влияния одной переменной на зависимую переменную?
00
Вопрос или проблема У меня есть четыре независимые переменные для анализа их влияния на одну зависимую переменную. Одна из независимых переменных закодирована в процентах. Как я могу определить ее влияние на зависимую переменную.
Data Science
Верните градиент и y-перехват (m, b), чтобы создать две линии, наилучшим образом подходящие к данным.
00
Вопрос или проблема Я работаю над этой задачей уже несколько часов и не добился успеха в получении нужного результата. Я пробовал использовать несколько методов разбиения набора данных с помощью различных методов кластеризации и логистической регрессии, но безрезультатно.
Data Science
Является ли обычным, что стандартный скейлер Scikit learn вызывает необратимость?
00
Вопрос или проблема Например, я пытаюсь выполнить линейную регрессию на следующем наборе данных Примеры данных: $X = [[1, 20], [3, 40], [5, 60]]$ (каждая строка — это пример, всего три примера, каждый с признаком размерности $2$, организованы в массив
Data Science
Включите время как переменную в регрессионную модель.
00
Вопрос или проблема В настоящее время я работаю над проблемой регрессии, которая требует предсказать стоимость основного средства. Я использовал несколько переменных для этого и вывел предсказанную стоимость. Однако мой руководитель захотел, чтобы я включил
Data Science
Линейная и нелинейная зависимость в единой DS модели
00
Вопрос или проблема У меня есть набор данных с параметрами (признаками) a, b, c и т.д. Нам нужно разработать модель для предсказания a (наша цель). b значительно коррелирует с a (85%), и я подозреваю линейную зависимость. c является измерением b на другой
Data Science
В чем разница между остаточной суммой квадратов и методом наименьших квадратов?
00
Вопрос или проблема На первый взгляд они кажутся одинаковыми, но я не уверен. Обновление: оглядываясь назад, это был не очень хороший вопрос. OLS относится к нахождению линии, которая соответствует данным, а RSS является функцией стоимости, используемой OLS.
Data Science
Разные значимые переменные, но одинаковое значение Скорректированного R-квадрата.
00
Вопрос или проблема Я выполнил множественную линейную регрессию на 64 переменных с тремя различными моделями: Выполнена множественная линейная регрессия на всех 64 переменных Выполнен отбор признаков с помощью случайного леса, затем множественная линейная
Data Science
Линейная регрессия с коэффициентами из LightGBM.
00
Вопрос или проблема Мне интересно, пробовал ли кто-нибудь использовать LightGBM для оценки альфа и бета параметров модели линейной регрессии. Я изучаю это, потому что ищу интерпретируемую модель. Прямая регрессия lgbm была бы более черным ящиком, чем мне хотелось бы.
Data Science
Множественная линейная регрессия для объяснения влияния предикторов.
00
Вопрос или проблема Я пытаюсь построить многовариантную линейную регрессию, и основная цель заключается в том, чтобы понять, как различные характеристики влияют на отклик, изучая коэффициенты и их доверительные интервалы. По этой причине я выбрал многовариантную
Data Science
Разделение данных на признаки/метки и обучение/тестирование после чтения из csv файла.
00
Вопрос или проблема Мне нужно прочитать данные из файла CSV, а затем разделить эти данные на признаки и метки, а затем на обучающую и тестовую выборку. Однако возникает несколько проблем снова и снова. Ниже приведен код, который я пытался использовать
Data Science
Данные для обучения в анализе настроений
00
Вопрос или проблема Я занимаюсь анализом настроений твитов, связанных с недавним приобретением Twitter Илоном Маском. У меня есть корпус из 10 000 твитов, и я хотел бы использовать методы машинного обучения с использованием таких моделей, как SVM и линейная регрессия.
Data Science
Может кто-то помочь мне с функцией стоимости в линейной регрессии? Как видно из приведенного ниже графика, у нас есть входные значения и предсказанное значение, но нет значения Y, помогите.
00
Вопрос или проблема Может кто-то помочь, пожалуйста? Я это не понимаю Я собираюсь решить другую задачу, чтобы у вас всё равно была возможность что-то сделать самостоятельно для домашнего задания, но это должно дать вам шаблон для решения вашей задачи.
Data Science
Предобработка данных для задачи множественной линейной регрессии
00
Вопрос или проблема Для задачи множественной линейной регрессии у меня есть как категориальные, так и числовые переменные в данных. Я проверяю корреляцию для числовых переменных для EDA и стандартизирую их, взяв логарифм. Остальные столбцы категориальных
Data Science
Модель линейной регрессии
00
Вопрос или проблема Я прохожу курс по Управляемому обучению в R: Регрессия. Есть раздел, в котором мне нужно предсказать артериальное давление, учитывая возраст и вес. Это был МОЙ подход # Создать формулу и вывести ее fmla <
Data Science
Сильно выраженная мультиколлинеарность влияет на решение линейной регрессии методом градиентного спуска?
00
Вопрос или проблема Поскольку метод наименьших квадратов может дать сбой при наличии серьезной/почти идеальной мультиколлинеарности, как будет работать градиентный спуск в такой ситуации? Он будет сходиться к минимуму? (Мое предположение –
Data Science
Реализация формулы градиентного спуска на Python
00
Вопрос или проблема Недавно я начал курс по машинному обучению от Эндрю Нга, и вот формула, которую Эндрю приводит для расчета градиентного спуска на линейной модели. $$ \theta_j = \theta_j – \alpha \frac{1}{m} \sum_{i=1}^m \left( h_\theta(x^{(i)}) –
Data Science
Почему результат так сильно меняется для линейной регрессии с константой и без нее?
00
Вопрос или проблема Я проводил линейную регрессию с использованием набора данных Wooldridge под названием GPA2, который можно найти в библиотеке Python с именем wooldridge. Я попытался провести два линейных регрессионных анализа.
Data Science
Переобучение в линейной регрессии
01
Вопрос или проблема Я только начинаю изучать машинное обучение, и мне трудно понять, как может произойти переобучение в модели линейной регрессии. Учитывая, что мы используем только 2 признака для обучения модели, как может плоская плоскость быть переобученной по набору данных?
Data Science
С помощью ридж-регрессии веса могут приближаться к 0 при больших значениях ламбда, но никогда не равняться 0 (в отличие от Lasso). Почему?
00
Вопрос или проблема Я пытался понять, почему регрессия с риджем имеет веса, близкие к 0 при больших значениях лямбда, но они никогда не равны 0, в отличие от лассо и простой линейной регрессии. Согласно этому веб-сайту: https://www.
Data Science
Что я могу сделать, чтобы устранить регрессию с систематическим смещением к середине?
00
Вопрос или проблема Я создал линейную регрессию, но мой предсказанный вывод обычно слишком низок для истинно высоких значений и слишком высок для истинно низких значений. Я пытался ввести конвейер, где использую полиномиальные функции, что в целом улучшило