Как сравнить пуассоновский процесс точек, ARIMA и LSTM?

Содержание

Вопрос или проблема
Ответ или решение
Основные характеристики моделей
Методы сравнения моделей
Рекомендации по сравнительным исследованиям
Заключение

Вопрос или проблема

Я пытаюсь сравнить три техники прогнозирования:

Стационарный стохастический процесс Пуассона-GEV: где скорость возникновения событий задана пуассоновским процессом, а его интенсивность описывается распределением генеральных экстремальных значений (GEV).
Автогрессивная интегрированная скользящая средняя (ARIMA)
Сеть долгосрочной и краткосрочной памяти (LSTM)

Можно сравнить подгонку модели Пуассона-GEV к данным, используя критерий информации Акаике (AIC); наилучшей подгонкой будет меньшая AIC. Аналогично можно сравнить LSTM и ARIMA, используя среднеквадратичную ошибку (RMSE).

Однако мне было довольно сложно найти способ получить AIC для сети долгосрочной и краткосрочной памяти, поскольку количество параметров мне неясно. В поисках решения я нашел эту страницу. Я все еще в замешательстве.

Любые советы были бы очень полезны. Большое спасибо!

Один из самых распространенных способов сравнения производительности разных моделей – это предсказательная способность на отложенной выборке данных.

Выделите данные, которые модели не видели во время обучения. Затем сравните производительность разных моделей на одном и том же наборе данных, используя одинаковую метрику оценки. Среднеквадратичная ошибка (RMSE) является примером метрики оценки.

Ответ или решение

Сравнение моделей прогнозирования, таких как стохастический пуассоновский процесс с распределением Гевина (Poisson-GEV), авторегрессионная интегрированная скользящая средняя (ARIMA) и длинная краткосрочная память (LSTM), является важной задачей в области анализа временных рядов и машинного обучения. В этом ответе мы подробно рассмотрим ключевые аспекты каждой модели, методы их сравнения и некоторые рекомендации по вычислению критериев качества.

Основные характеристики моделей

Пуассоновский процесс с распределением Гевина (Poisson-GEV):
- Этот процесс используется для моделирования случайных событий, связанных с интенсивностью их появления. Время между событиями в пуассоновском процессе имеет экспоненциальное распределение, а интенсивность в данном случае регулируется распределением Гевина.
- Применяется в ситуациях, когда важно учитывать экстремальные значения, например, в гидрологии или финансовом анализе.
ARIMA (авторегрессионная интегрированная скользящая средняя):
- Это классическая статистическая модель для прогнозирования временных рядов, которая учитывает как прошлые значения самого ряда (авторегрессия), так и прошлые ошибки (скользящая средняя). Также ARIMA включает интеграцию для работы с нестационарными данными.
- Подходит для широкого спектра временных рядов, где известна сезонная или трендовая структура.
LSTM (длинная краткосрочная память):
- Это тип рекуррентной нейронной сети, который способен захватывать долгосрочные зависимости в данных. LSTM подходит для сложных, нерегулярных временных рядов и может эффективно работать с большим количеством параметров.
- Нейронные сети, в отличие от моделей ARIMA, не требуют строгих предположений о стационарности данных.

Методы сравнения моделей

Критерий информации Акаике (AIC):
- AIC используется для оценки качества моделей, основываясь на количестве параметров и уровне ошибок. Низкое значение AIC говорит о лучшем соответствии модели данным.
- Для Poisson-GEV AIC можно рассчитать, опираясь на логарифм правдоподобия модели и количество параметров.
Корень среднеквадратичной ошибки (RMSE):
- RMSE измеряет разницу между предсказанными и фактическими значениями и часто используется для сравнения производительности ARIMA и LSTM.
- Для получения RMSE необходимо разделить данные на обучающую и тестовую выборки и рассчитать RMSE на тестовой выборке.
Расчет AIC для LSTM:
- Проблема определения числа параметров в LSTM заключается в том, что их количество жестко зависит от конфигурации сети: числа слоев, числа нейронов в каждом слое и других компонентов. Иногда считают, что число параметров можно приближенно оценить как число нейронов и связей между ними.
- Один из путей — использовать численный подход: обучить модель и вычислить градиенты. Тем не менее, это может оказаться сложным и ресурсозатратным.

Заключение

Сравнение моделей Poisson-GEV, ARIMA и LSTM требует глубокого понимания как математической основы, так и особенностей каждой методологии. Используйте AIC для статистических моделей и RMSE для нейросетевых подходов, обращая внимание на специфические детали реализации. Это даст более полное представление о прогнозной способности каждой из моделей и позволит сделать обоснованный выбор в соответствии с требованиями вашего проекта.