Data Science
RMSE и R-квадрат
00
Вопрос или проблема Вопрос: Какой из метрик лучше для сравнения разных моделей: RMSE или R-квадрат? Я немного поискал, обычно все блоги говорят, что обе метрики объясняют разные идеи: R-квадрат является мерой того, сколько вариации объясняет модель, а
Data Science
Правильно ли работает моя модель SVR?
00
Вопрос или проблема Я занимаюсь моделированием прогнозирования ветра, используя модель SVR, и хотел бы сравнить фактические данные о скорости ветра и предсказанные данные. Я не уверен, что я сделал неправильно. Я предварительно обработал наборы данных и нормализовал их. >
Data Science
Пользовательская функция потерь
00
Вопрос или проблема Можно ли применить пользовательскую функцию потерь в модели регрессии (или любом другом алгоритме для прогнозирования непрерывной переменной)? Я работаю над моделью прогнозирования фондового рынка, и мне нужно максимизировать следующую
Data Science
Подход машинного обучения для обнаружения ботов
00
Вопрос или проблема Я работаю над проектом, который пытается определить, являются ли пользователи ботами или нет. В настоящее время метки, которые содержит набор данных, ненадежны, но я нашел некоторые тенденции/особенности, которые хорошо подходят для
Data Science
ANOVA процедура – Регрессия
00
Вопрос или проблема Я новичок в регрессии. Может кто-то объяснить мне, как сумма квадратов регрессии показывает объясненную вариацию? По сути, почему это (у шляпа – у бар)? Надеюсь, я точно объясняю свой вопрос. Я пытался нарисовать график с регрессионной
Data Science
Коррекция одного из нескольких сильных батч-эффектов в наборе данных.
00
Вопрос или проблема Мне интересно, какие статистические инструменты использовать при анализе данных, имеющих несколько сильных эффектов партии (распределения варьируются от одной партии к другой). Я хотел бы скорректировать эффект партии, когда он возникает
Data Science
Умное вычисление возврата инвестиций в рекламу
00
Вопрос или проблема Ищу способ прогнозировать возврат на рекламные расходы (ROAS). Не обязательно, чтобы это была сложная модель (на самом деле, было бы гораздо лучше, если бы это не было так!). У нас есть все данные, поступающие через наш SQL-пipeline
Data Science
Смысленная предсказательная аналитика для небольшого (n=114) набора данных с всего лишь 1 объясняющей переменной и 1 ответной переменной?
00
Вопрос или проблема Мне дана сводная таблица Excel, которая агрегирует данные из довольно большого источника данных (таблица базы данных с 1,9 миллиона записей и другая с около 490 тысяч). Данные внутри файла Excel состоят из 3 колонок: даты понедельников
Data Science
Вывод производной первого порядка для рядов Тейлора в авторегрессионной модели.
00
Вопрос или проблема Я написал пост в блоге, в котором я вычислил ряд Тейлора авторегрессионной функции. Это не строго ряд Тейлора, а какая-то его вариация (как я полагаю). Меня больше всего беспокоит, выглядят ли производные нормально.
Data Science
Какую предсказательную модель выбрать?
00
Вопрос или проблема Я полностью потерялся, пытаясь выбрать тип предсказательной модели для своей задачи. Это авторегрессионная модель, нелинейная временная серия, марковская цепь или что-то другое? Может кто-то дать мне совет?
Data Science
Как включить предикторную переменную без информации о будущем в модель?
00
Вопрос или проблема Я приведу крайне упрощенный пример, чтобы проиллюстрировать вопрос, но я думаю, что ответ должен быть актуален и для более обобщенных случаев. Предположим, я хочу создать регрессионную модель временного ряда (сама модель не имеет значения
Data Science
Тренировка в течение трех последовательных дней для прогнозирования четвертого дня.
00
Вопрос или проблема У меня есть следующая задача: Обучение по последовательным 3 дням для предсказания 4-го дня. Каждый день данных представляет собой один CSV файл, который имеет размеры 24×25. Каждая точка данных в каждом CSV файле является пикселем.
Data Science
Обучение по многомерным данным
00
Вопрос или проблема У меня есть следующая задача: тренировочная программа на протяжении 3 дней для прогнозирования 4-го дня. Каждодневные данные представлены в виде одного CSV файла с размерами 24×25. Каждая точка данных в каждом CSV файле соответствует пикселю.
Data Science
Предварительная обработка многомерных данных
00
Вопрос или проблема Я пытаюсь понять, как работает предобработка многомерных данных, но у меня есть несколько вопросов. Например, я могу выполнять сглаживание данных, преобразование (бокс-кокс, дифференцирование), удаление шума в одномерных данных (для
Data Science
Мне стоит получить фиктивные переменные, а затем посмотреть на многоколлинеарность?
00
Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).
Data Science
Как вычислить временно задержанную корреляцию между двумя переменными с множеством примеров в каждый момент времени t?
00
Вопрос или проблема У меня есть словарь следующей формы: datetimes = {год : {имя : (оценка1, оценка2)}} # есть 50+ имен/год Таким образом, по сути, я пытаюсь получить общее представление о том, как оценка1 в год_n коррелирует с оценкой2 в год_n.
Data Science
Прогнозы нейронной регрессии вокруг среднего значения цели
00
Вопрос или проблема У меня есть регрессионная модель с трансформером и некоторые данные о последних транзакциях пользователей (категориальные и числовые). Моя целевая переменная имеет экспоненциальное распределение со средним около 10e4 и также имеет
Data Science
Снизьте переобучение модели на одном подмножестве данных.
00
Вопрос или проблема У меня есть набор данных о продажах продуктов. В этом наборе данных есть случаи, когда происходят markdown-скидки. Исторически, обычно в данных ранее было 30% скидок, когда продукты продавались лучше, а комбинации скидок 30% и 50%
Data Science
Переподбор нормально распределенного набора данных для регрессионных задач?
00
Вопрос или проблема У меня есть набор данных из операционного процесса с 5 измерениями и 1 результатом. Все значения нормально распределены. Когда я обучаю регрессионную модель на этом наборе данных, она хорошо работает на большинстве данных – в условиях по умолчанию.
Data Science
Что делать, когда тестовые значения не коррелируют с прогнозами?
00
Вопрос или проблема У меня есть задача регрессии, где я получил среднюю абсолютную ошибку, близкую к желаемому значению, но предсказания плохо коррелируют с ожидаемыми значениями. Я пробовал несколько алгоритмов, сопоставил их с GridSearchCV.