Вопрос или проблема
Цель: Предсказать желтые точки (желтые события появляются с разной частотой).
Но мне сложно найти хорошую модель для этого случая.
Большинство алгоритмов временных рядов работают с данными, имеющими одинаковую частоту (например, ежедневно/каждые 10 секунд). Я попробовал много разных решений, но, возможно, выбрал совершенно неправильный подход.
Большое спасибо за любые подсказки!!!
Это похоже на данные о ценах на акции. Вы можете использовать fbprophet (python), BATS (R), TBATS (R) для прогнозирования данных.
Вы сказали, что ваша модель содержит разные частоты, что означает, что в ней более одной сезонности.
Для определения сезонности (частот) вы можете использовать преобразование Фурье. У вас должно быть достаточно данных для получения хорошего прогноза.
Требуется немного больше информации, чем просто график.
Например, какие все особенности вместе с типом данных.
Если это только этот график, то
- Данные могут поступать от научного прибора, судя по показаниям по оси Y.
- Попробуйте выявить тренд, сезонность и шум, сначала декомпозировав их.
- Вы можете использовать LSTM, так как они хорошо справляются с обработкой временных рядов.
.
Ответ или решение
Определение модели временного ряда, способной работать с данными на переменных временных интервалах, представляет собой уникальную задачу, особенно когда данные, как в описанном случае, имеют нерегулярные временные отметки, подобные появлению желтых точек на графике.
Варианты подходов к моделированию временных рядов на переменных частотах
-
Модель Prophet от Meta (ранее Facebook): Prophet специально разработан для обработки временных рядов с отсутствующими данными и изменяющейся частотой событий. Этот инструмент позволяет моделировать сезонные и годовые тенденции, что может быть полезно для данных с различной частотой событий, таких как в вашем сценарии.
-
Модели BATS и TBATS: Это расширенные методы, реализованные в R, которые могут учитывать множественную сезонность и изменяющиеся частоты данных. Эти модели являются особенно полезными, если ваши данные действительно демонстрируют сложные сезонные паттерны.
-
Использование Пакетов для Предобученных Списокных Моделей (LSTM): Если данные имеют сложные временные паттерны, рекуррентные нейронные сети (RNN), такие как LSTM, могут эффективно их моделировать. Это особенно полезно для данных, где традиционные сезонные модели менее применимы.
Анализ данных и предварительная обработка
-
Декомпозиция ряда: Прежде чем выбирать модель, полезно определить, содержит ли временной ряд трендовые компоненты, сезонность или шум. Декомпозиция ряда на эти компоненты может помочь лучше понять структуру ваших данных.
-
Использование преобразования Фурье: Преобразование Фурье позволяет выявить частоты, присутствующие в данных. Это может помочь определить, существуют ли определенные периодические паттерны, которые стоит учитывать при моделировании.
Дополнительные соображения
-
Наличие Достаточного Количества Данных: Для успешного прогнозирования переменной частоты событий необходимо иметь достаточное количество исторических данных. Это позволяет моделям лучше обучаться и выявлять скрытые паттерны.
-
Определение Дополнительных Факторов: Зачастую полезно рассматривать дополнительные объясняющие переменные, если они доступны. Это могут быть временные метки, влияющие на переменную частоту событий.
Работа с временными рядами, изменяющими частоту, действительно требует тщательного подхода и анализа, однако современные инструменты и методы предоставляют возможности для успешного решения подобных задач. Надеюсь, данное руководство будет полезно для вас в подходах к моделированию вашего временного ряда.