Data Science
Становится ли с точки зрения статистики неправильно корректировать по полу и расе, а затем делать подгруппы на их основе в R?
00
Вопрос или проблема Я хочу узнать ваше мнение: Я провожу анализ подгрупп по ранней смертности (Результат), основанный на Переливании (С УЧЕТОМ как Пола, так и РАСЫ), и получил результаты, показывающие, что переливание ассоциировано с более высокой смертностью
Data Science
Почему результат так сильно меняется для линейной регрессии с константой и без нее?
00
Вопрос или проблема Я проводил линейную регрессию с использованием набора данных Wooldridge под названием GPA2, который можно найти в библиотеке Python с именем wooldridge. Я попытался провести два линейных регрессионных анализа.
Data Science
Регрессия нейронной сети с отрицательной производительностью
00
Вопрос или проблема У меня есть проблема с производительностью многослойного перцептрона-регрессора (нейронной сети), и я не могу понять, почему. Задача: Я пытаюсь улучшить прогноз времени. У меня есть прогнозы физического параметра за последние 4 года
Data Science
Дисагрегация энергетических данных с помощью регрессионной модели/LSTM
00
Вопрос или проблема В настоящее время я пытаюсь разработать модель, которая принимает временной ряд данных о электроэнергии из домохозяйства в качестве входных данных и должна дисагрегировать эти данные о основном электроснабжении на конкретное потребление
Data Science
Пространственно ограниченная геопространственная схожесть
00
Вопрос или проблема Какова текущая методология кластеризации геопространственных данных по признакам? Пример: у меня есть демографический набор данных. Допустим, он содержит среднюю цену на жилье и плотность населения. Таким образом, пример корреляции
Data Science
Регрессия – Модель в целом выглядит хорошо, но R2 неожиданно отрицательно высок.
00
Вопрос или проблема Я строил модель линейной регрессии с около 150 строками данных. Я проверил корреляцию параметров с целевой переменной и попытался оставить только их, так как у меня меньше данных, и я хотел получить простую линейную модель.
Data Science
Обработка почти дублирующих наблюдений в регрессионной / байесовской модели
00
Вопрос или проблема Я работаю над моделью, в которой исходные данные по своей природе коррелированы группами. Поэтому некоторые из моих наблюдений почти дублируют друг друга, но не совсем. Проблема довольно проста: у меня есть переменная y, которую нужно
Data Science
Как применить контролируемое машинное обучение, когда целевая переменная зависит от нескольких строк (с различным количеством строк)?
00
Вопрос или проблема Вот пример набора данных, который похож на тот, который я использую. Назовем одну строку = один эксперимент. Я пытаюсь предсказать Y на основе признаков X1 до X7 Проблема, с которой я сталкиваюсь, очень похожа на эту, в том смысле
Data Science
Структурирование данных эксперимента/обучения с учетом месяцев
00
Вопрос или проблема Мы используем данные за целый год для предсказания определенной целевой переменной. Модель работает как данные – OneHot кодирование категориальных переменных – MinMaxScaler – PCA (для выбора подмножества из 2000 компонентов из 15к) –
Data Science
Как обеспечить одинаковый шаблон кодирования?
00
Вопрос или проблема Я создал модель XGBRegressor с определенными закодированными даными типа ‘object’ в данных. Теперь, если я хочу запустить модель с новым набором данных, который только что закодирован, она дает неправильные предсказания.
Data Science
Соберите нейронную сеть для многовыходной регрессии.
00
Вопрос или проблема У меня есть нейронная сеть, которая принимает около 25 входов и выдает 3 действия. Выходы: дельта X и дельта Y робота и угол робота. После ввода данных в модель я получаю очень разные (и странные) предсказания угла. В чем может быть причина?
Data Science
Могу ли я использовать кластеризацию после классификации для улучшения производительности моего классификатора?
00
Вопрос или проблема Предположим, у меня есть классификатор, который сегментирует мои векторные характеристики (например, представляющие соискателей) на 3 разных сегмента A, B, C, присваивая каждому соискателю оценку от 0 (хуже) до 1 (лучше) с помощью
Data Science
Классификация нелинейных регрессий по их формам
00
Вопрос или проблема У меня есть набор данных, состоящий из тысяч индивидуальных зависимостей y ~ x, которые могут иметь разные формы. Например, они могут следовать экспоненциальному, асимптотическому, логистическому или формы с горбом (с различной ассиметрией) паттерну.
Data Science
Как мы различаем скоррелированные и не скоррелированные характеристики/переменные? Это имеет значение для регрессионного анализа?
00
Вопрос или проблема Коррелированные и некоррелированные термины часто используются в области науки о данных и рассматриваются как если бы они представляли коэффициент корреляции. Это правильный подход? Да! Корреляция между признаками/атрибутами действительно
Data Science
Радиальная базисная функция для увеличения данных
00
Вопрос или проблема У меня есть набор данных с 20 признаками и 65 образцами. Модели показывали плохие результаты, поэтому я использовал scipy.rbf для интерполяции и добавил 300 дополнительных образцов в набор данных. Производительность моделей значительно
Data Science
регрессионная модель превосходит все модели
00
Вопрос или проблема Я следил за этим вопросом. Случай 1: У меня задача: обучаться на протяжении трех последовательных дней, чтобы предсказать каждый четвертый день. Данные каждого дня представляют собой один CSV файл, который имеет размеры 24×
Data Science
Насколько эффективен псевдообратный оператор Мура-Пенроуза для решения задач регрессии с переопределенной системой уравнений?
00
Вопрос или проблема Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач. Насколько хорошо это “
Data Science
Нахождение уравнения для модели множественной и нелинейной регрессии?
00
Вопрос или проблема Что касается нелинейной и многомерной регрессии, я использую R или Matlab. В случае, когда у меня есть регрессия только с двумя переменными, я просто рисую график Y относительно X и ищу уравнение модели, которое наилучшим образом соответствует
Data Science
Как выполнить мультивариантную регрессию в Orange?
00
Вопрос или проблема Orange содержит ряд регрессионных виджетов, но все они кажутся унивариабельными, т.е. одна независимая переменная коррелирует с одной зависимой переменной. Когда у меня есть больше независимых переменных, которые могут влиять на зависимую
Data Science
Какая архитектура машинного обучения подходит для регрессии сигналов фиксированной длины?
00
Вопрос или проблема Моя проблема имеет регрессионный характер – Как оценить вес рыбы, используя сигнал фиксированной длины (80 точек данных) изменения сопротивления, когда рыба проплывает через ворота с электроды (по сути, 4 секунды прохождения