Найти короткие похожие последовательности в длинных временных рядах

Вопрос или проблема

Входные данные — это короткий временной ряд, и я хочу найти масштабируемую короткую последовательность, которая выглядела бы как входная, из длинного временного ряда. Стоит ли использовать скользящее окно, или у вас есть какие-то лучшие предложения?

Можете ли вы четко разделить короткие последовательности, или они сливаются вместе?

Если у них есть четкое временное разделение (например, день или неделя), вы можете задать пакет короткого времени и правильно изучить каждую короткую последовательность.

В противном случае вам нужно найти способы правильно отделить короткие последовательности, чтобы они не перекрывались.

В обоих случаях вы можете обнаружить формы коротких последовательностей, например, с помощью 2D CNN.

https://towardsdatascience.com/how-to-use-convolutional-neural-networks-for-time-series-classification-56b1b0a07a57

Ответ или решение

Теория

Поиск коротких подобных последовательностей в длинных временных рядах является сложной задачей анализа данных. Это связано с тем, что временные ряды могут содержать множество скрытых и явных паттернов, среди которых необходимо выделить те, которые наиболее близко соответствуют заданной короткой последовательности. В этой проблеме можно выделить несколько основных шагов:

  1. Декомпозиция временного ряда: Прежде чем искать подобные последовательности, необходимо разбить временной ряд на меньшие части. Это может быть сделано с помощью метода скользящего окна, который позволяет выделить подрегионы фиксированного размера и сдвигаться на определенный шаг.

  2. Нормализация данных: Временные ряды могут отличаться по масштабу из-за различных причин, таких как сезонность, тренды и аномалии. Поэтому нужно нормализовать данные, чтобы стандартные методы обнаружения могли использоваться в последовательностях равного масштаба.

  3. Сравнение последовательностей: Используются различные метрики для оценки сходства. Среди популярных метрик можно выделить Евклидово расстояние, DTW (динамический временной изоморфизм) и корреляционные методы.

  4. Методы обучения: Использование методов машинного обучения, таких как CNN (сверточные нейронные сети), может позволить выявить более сложные паттерны, которые не видны глазом.

  5. Оценка и валидация: Любой найденный паттерн должен быть проверен на реалистичность и иметь значимую интерпретацию в контексте задачи.

Пример

Рассмотрим, к примеру, задачу обнаружения аномальных всплесков в показателях температуры. Входной временной ряд представляет собой список температурных данных за последние 10 лет, тогда как короткая последовательность относится к аномальному периоду с резким повышением температуры в определенное время года.

  1. Декомпозиция: Используя метод скользящего окна, мы разбиваем данные на месячные или недельные сегменты.

  2. Нормализация: Мы нормируем данные, чтобы избежать влияния сезонных изменений или долгосрочных трендов на результат анализа.

  3. Сравнение: Используя DTW, сравниваем каждую сегментированную последовательность с заданным всплеском.

  4. Обучение: Применение CNN для уловки более сложных паттернов в данных, которые могут свидетельствовать об аномальных изменениях температуры в прошлом.

  5. Валидация: Сравниваем результаты анализа с известными событиями температурных аномалий за указанный период.

Применение

Решение задачи поиска подобных последовательностей жизненно важно в различных сферах, таких как экономический анализ, прогнозирование погодных условий, диагностика медицинских состояний и логистика. Эти задачи требуют высокоточной идентификации временных паттернов для принятия обоснованных решений.

  • Экономика: Позволяет выявить значимые тренды в условиях слишком волатильного рынка, предоставляя возможность прогнозирования.

  • Медицина: Удобно для мониторинга жизненных показателей пациента, чтобы вовремя выявить изменение состояния здоровья.

  • Логистика: Используется для прогнозирования потребностей в продуктах или перемещения активов в зависимости от исторических данных.

Таким образом, успешное применение автоматических методов позволит не только находить короткие подобные последовательности, но и извлекать из них важную информацию для дальнейшей оптимизации работы в различных отраслях.

Оцените материал
Добавить комментарий

Капча загружается...