linear-regression
Data Science
Вопрос или проблема У меня есть четыре независимые переменные для анализа их влияния на одну зависимую переменную. Одна из независимых переменных закодирована в процентах. Как я могу определить ее влияние на зависимую переменную.
Data Science
Вопрос или проблема Я работаю над этой задачей уже несколько часов и не добился успеха в получении нужного результата. Я пробовал использовать несколько методов разбиения набора данных с помощью различных методов кластеризации и логистической регрессии, но безрезультатно.
Data Science
Вопрос или проблема Например, я пытаюсь выполнить линейную регрессию на следующем наборе данных Примеры данных: $X = [[1, 20], [3, 40], [5, 60]]$ (каждая строка — это пример, всего три примера, каждый с признаком размерности $2$, организованы в массив
Data Science
Вопрос или проблема В настоящее время я работаю над проблемой регрессии, которая требует предсказать стоимость основного средства. Я использовал несколько переменных для этого и вывел предсказанную стоимость. Однако мой руководитель захотел, чтобы я включил
Data Science
Вопрос или проблема У меня есть набор данных с параметрами (признаками) a, b, c и т.д. Нам нужно разработать модель для предсказания a (наша цель). b значительно коррелирует с a (85%), и я подозреваю линейную зависимость. c является измерением b на другой
Data Science
Вопрос или проблема На первый взгляд они кажутся одинаковыми, но я не уверен. Обновление: оглядываясь назад, это был не очень хороший вопрос. OLS относится к нахождению линии, которая соответствует данным, а RSS является функцией стоимости, используемой OLS.
Data Science
Вопрос или проблема Я выполнил множественную линейную регрессию на 64 переменных с тремя различными моделями: Выполнена множественная линейная регрессия на всех 64 переменных Выполнен отбор признаков с помощью случайного леса, затем множественная линейная
Data Science
Вопрос или проблема Мне интересно, пробовал ли кто-нибудь использовать LightGBM для оценки альфа и бета параметров модели линейной регрессии. Я изучаю это, потому что ищу интерпретируемую модель. Прямая регрессия lgbm была бы более черным ящиком, чем мне хотелось бы.
Data Science
Вопрос или проблема Я пытаюсь построить многовариантную линейную регрессию, и основная цель заключается в том, чтобы понять, как различные характеристики влияют на отклик, изучая коэффициенты и их доверительные интервалы. По этой причине я выбрал многовариантную
Data Science
Вопрос или проблема Мне нужно прочитать данные из файла CSV, а затем разделить эти данные на признаки и метки, а затем на обучающую и тестовую выборку. Однако возникает несколько проблем снова и снова. Ниже приведен код, который я пытался использовать
Data Science
Вопрос или проблема Я занимаюсь анализом настроений твитов, связанных с недавним приобретением Twitter Илоном Маском. У меня есть корпус из 10 000 твитов, и я хотел бы использовать методы машинного обучения с использованием таких моделей, как SVM и линейная регрессия.
Data Science
Вопрос или проблема Может кто-то помочь, пожалуйста? Я это не понимаю Я собираюсь решить другую задачу, чтобы у вас всё равно была возможность что-то сделать самостоятельно для домашнего задания, но это должно дать вам шаблон для решения вашей задачи.
Data Science
Вопрос или проблема Для задачи множественной линейной регрессии у меня есть как категориальные, так и числовые переменные в данных. Я проверяю корреляцию для числовых переменных для EDA и стандартизирую их, взяв логарифм. Остальные столбцы категориальных
Data Science
Вопрос или проблема Я прохожу курс по Управляемому обучению в R: Регрессия. Есть раздел, в котором мне нужно предсказать артериальное давление, учитывая возраст и вес. Это был МОЙ подход # Создать формулу и вывести ее fmla <
Data Science
Вопрос или проблема Поскольку метод наименьших квадратов может дать сбой при наличии серьезной/почти идеальной мультиколлинеарности, как будет работать градиентный спуск в такой ситуации? Он будет сходиться к минимуму? (Мое предположение –
Data Science
Вопрос или проблема Недавно я начал курс по машинному обучению от Эндрю Нга, и вот формула, которую Эндрю приводит для расчета градиентного спуска на линейной модели. $$ \theta_j = \theta_j – \alpha \frac{1}{m} \sum_{i=1}^m \left( h_\theta(x^{(i)}) –
Data Science
Вопрос или проблема Я проводил линейную регрессию с использованием набора данных Wooldridge под названием GPA2, который можно найти в библиотеке Python с именем wooldridge. Я попытался провести два линейных регрессионных анализа.
Data Science
Вопрос или проблема Я только начинаю изучать машинное обучение, и мне трудно понять, как может произойти переобучение в модели линейной регрессии. Учитывая, что мы используем только 2 признака для обучения модели, как может плоская плоскость быть переобученной по набору данных?
Data Science
Вопрос или проблема Я пытался понять, почему регрессия с риджем имеет веса, близкие к 0 при больших значениях лямбда, но они никогда не равны 0, в отличие от лассо и простой линейной регрессии. Согласно этому веб-сайту: https://www.
Data Science
Вопрос или проблема Я создал линейную регрессию, но мой предсказанный вывод обычно слишком низок для истинно высоких значений и слишком высок для истинно низких значений. Я пытался ввести конвейер, где использую полиномиальные функции, что в целом улучшило