regression - ответы на вопросы - Page 5 of 9

Data Science

00

Вопрос или проблема Вопрос: Какой из метрик лучше для сравнения разных моделей: RMSE или R-квадрат? Я немного поискал, обычно все блоги говорят, что обе метрики объясняют разные идеи: R-квадрат является мерой того, сколько вариации объясняет модель, а

Data Science

Правильно ли работает моя модель SVR?

00

Вопрос или проблема Я занимаюсь моделированием прогнозирования ветра, используя модель SVR, и хотел бы сравнить фактические данные о скорости ветра и предсказанные данные. Я не уверен, что я сделал неправильно. Я предварительно обработал наборы данных и нормализовал их. >

Data Science

Пользовательская функция потерь

00

Вопрос или проблема Можно ли применить пользовательскую функцию потерь в модели регрессии (или любом другом алгоритме для прогнозирования непрерывной переменной)? Я работаю над моделью прогнозирования фондового рынка, и мне нужно максимизировать следующую

Data Science

Подход машинного обучения для обнаружения ботов

00

Вопрос или проблема Я работаю над проектом, который пытается определить, являются ли пользователи ботами или нет. В настоящее время метки, которые содержит набор данных, ненадежны, но я нашел некоторые тенденции/особенности, которые хорошо подходят для

Data Science

ANOVA процедура – Регрессия

00

Вопрос или проблема Я новичок в регрессии. Может кто-то объяснить мне, как сумма квадратов регрессии показывает объясненную вариацию? По сути, почему это (у шляпа – у бар)? Надеюсь, я точно объясняю свой вопрос. Я пытался нарисовать график с регрессионной

Data Science

Коррекция одного из нескольких сильных батч-эффектов в наборе данных.

01

Вопрос или проблема Мне интересно, какие статистические инструменты использовать при анализе данных, имеющих несколько сильных эффектов партии (распределения варьируются от одной партии к другой). Я хотел бы скорректировать эффект партии, когда он возникает

Data Science

Умное вычисление возврата инвестиций в рекламу

00

Вопрос или проблема Ищу способ прогнозировать возврат на рекламные расходы (ROAS). Не обязательно, чтобы это была сложная модель (на самом деле, было бы гораздо лучше, если бы это не было так!). У нас есть все данные, поступающие через наш SQL-пipeline

Data Science

Смысленная предсказательная аналитика для небольшого (n=114) набора данных с всего лишь 1 объясняющей переменной и 1 ответной переменной?

00

Вопрос или проблема Мне дана сводная таблица Excel, которая агрегирует данные из довольно большого источника данных (таблица базы данных с 1,9 миллиона записей и другая с около 490 тысяч). Данные внутри файла Excel состоят из 3 колонок: даты понедельников

Data Science

Вывод производной первого порядка для рядов Тейлора в авторегрессионной модели.

00

Вопрос или проблема Я написал пост в блоге, в котором я вычислил ряд Тейлора авторегрессионной функции. Это не строго ряд Тейлора, а какая-то его вариация (как я полагаю). Меня больше всего беспокоит, выглядят ли производные нормально.

Data Science

Какую предсказательную модель выбрать?

00

Вопрос или проблема Я полностью потерялся, пытаясь выбрать тип предсказательной модели для своей задачи. Это авторегрессионная модель, нелинейная временная серия, марковская цепь или что-то другое? Может кто-то дать мне совет?

Data Science

Как включить предикторную переменную без информации о будущем в модель?

00

Вопрос или проблема Я приведу крайне упрощенный пример, чтобы проиллюстрировать вопрос, но я думаю, что ответ должен быть актуален и для более обобщенных случаев. Предположим, я хочу создать регрессионную модель временного ряда (сама модель не имеет значения

Data Science

Тренировка в течение трех последовательных дней для прогнозирования четвертого дня.

00

Вопрос или проблема У меня есть следующая задача: Обучение по последовательным 3 дням для предсказания 4-го дня. Каждый день данных представляет собой один CSV файл, который имеет размеры 24×25. Каждая точка данных в каждом CSV файле является пикселем.

Data Science

Обучение по многомерным данным

00

Вопрос или проблема У меня есть следующая задача: тренировочная программа на протяжении 3 дней для прогнозирования 4-го дня. Каждодневные данные представлены в виде одного CSV файла с размерами 24×25. Каждая точка данных в каждом CSV файле соответствует пикселю.

Data Science

Предварительная обработка многомерных данных

00

Вопрос или проблема Я пытаюсь понять, как работает предобработка многомерных данных, но у меня есть несколько вопросов. Например, я могу выполнять сглаживание данных, преобразование (бокс-кокс, дифференцирование), удаление шума в одномерных данных (для

Data Science

Мне стоит получить фиктивные переменные, а затем посмотреть на многоколлинеарность?

00

Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).

Data Science

Как вычислить временно задержанную корреляцию между двумя переменными с множеством примеров в каждый момент времени t?

00

Вопрос или проблема У меня есть словарь следующей формы: datetimes = {год : {имя : (оценка1, оценка2)}} # есть 50+ имен/год Таким образом, по сути, я пытаюсь получить общее представление о том, как оценка1 в год_n коррелирует с оценкой2 в год_n.

Data Science

Прогнозы нейронной регрессии вокруг среднего значения цели

00

Вопрос или проблема У меня есть регрессионная модель с трансформером и некоторые данные о последних транзакциях пользователей (категориальные и числовые). Моя целевая переменная имеет экспоненциальное распределение со средним около 10e4 и также имеет

Data Science

Снизьте переобучение модели на одном подмножестве данных.

00

Вопрос или проблема У меня есть набор данных о продажах продуктов. В этом наборе данных есть случаи, когда происходят markdown-скидки. Исторически, обычно в данных ранее было 30% скидок, когда продукты продавались лучше, а комбинации скидок 30% и 50%

Data Science

Переподбор нормально распределенного набора данных для регрессионных задач?

00

Вопрос или проблема У меня есть набор данных из операционного процесса с 5 измерениями и 1 результатом. Все значения нормально распределены. Когда я обучаю регрессионную модель на этом наборе данных, она хорошо работает на большинстве данных – в условиях по умолчанию.

Data Science

Что делать, когда тестовые значения не коррелируют с прогнозами?

00

Вопрос или проблема У меня есть задача регрессии, где я получил среднюю абсолютную ошибку, близкую к желаемому значению, но предсказания плохо коррелируют с ожидаемыми значениями. Я пробовал несколько алгоритмов, сопоставил их с GridSearchCV.