Методы кластеризации ежедневных паттернов для временных рядов

Вопрос или проблема

Вопрос: Привет всем,

В настоящее время я работаю над проектом, связанным с ежедневными паттернами использования GN2 (азотного газа). Моя основная цель – снизить вариацию ежедневных паттернов и минимизировать разрыв между производством и потреблением GN2, более эффективно анализируя эти паттерны. Вот краткий обзор моего подхода и проблем, с которыми я сталкиваюсь:

Обзор проекта:

Данные: У меня есть данные по использованию GN2, зарегистрированные в интервалах 10 минут, за более чем год. Паттерн каждого дня представлен в виде временного ряда с примерно 144 значениями.

Цель: Ключевой задачей является снижение вариации между ежедневными паттернами использования и создание представительных паттернов, которые могут помочь в согласовании производственного выхода с фактическим использованием.

Текущий подход:
Кластеризация на основе DTW: Я использую динамическое временное искажение (DTW) для кластеризации ежедневных паттернов и понимания внутренней структуры различных профилей использования.
Я также учитываю внешние переменные, такие как температура и влажность, так как они, похоже, влияют на потребление GN2.
После кластеризации я анализирую паттерны каждого кластера с точки зрения вариации ежедневного использования, разрывов между производством и потреблением, а также внешних факторов.

Проблемы:
Снижение вариации: Даже после кластеризации я наблюдаю, что вариация внутри каждого кластера все еще относительно высока, что затрудняет определение четкого, стабильного представительного паттерна.
Паттерны буднего и выходного дней: Я пробовал учитывать различия сезонности между будними и выходными днями, а также месячную сезонность в процессе кластеризации, но значительных различий в паттернах не наблюдается.
Согласование производства и использования: Моя окончательная цель – использовать эти паттерны для настройки производственного выхода в соответствии с прогнозируемым ежедневным использованием. Тем не менее, оставшаяся вариация все еще затрудняет эту предсказательную задачу.

Вопросы:
Как я могу еще больше снизить вариацию внутри ежедневного паттерна каждого кластера? Есть ли какие-либоadvanced techniques, которые мне стоит попробовать (например, использование вейвлет-преобразований, автоэнкодеров или других методов декомпозиции временных рядов)?

Стоит ли лучше разделить кластеризацию на кластеры будних/выходных дней или сезонные кластеры и затем повторно кластеризовать? Если да, то какие критерии следует использовать для определения значимых кластеров?
Есть ли предложения по более эффективному включению внешних переменных, таких как температура и влажность, в процесс кластеризации, чтобы уловить сезонность и изменения спроса?
Я открыт к любым отзывам или идеям о том, как улучшить этот анализ и сделать соответствие производства и потребления более точным. Любая информация о том, как справиться с оставшейся вариацией, будет очень полезна!

Заранее спасибо!

Ответ или решение

Здравствуйте!

Ваш проект по анализу ежедневных паттернов использования GN2 (азота) является весьма интересным и актуальным. Ниже я предложу несколько подходов, которые могут помочь уменьшить вариативность паттернов и улучшить соответствие между производством и потреблением.

1. Снижение вариативности в кластерах

Чтобы снизить вариативность внутри кластеров, можно рассмотреть следующие техники:

  • Декомпозиция временных рядов: Используйте методы декомпозиции временных рядов, такие как STL (Seasonal-Trend decomposition using LOESS), для извлечения трендов, сезонности и остаточных составляющих. Это может помочь выявить более устойчивые паттерны ежедневного использования GN2, которые можно использовать для последующей кластеризации.

  • Вейвлет-преобразования: Вейвлет-преобразования могут быть полезны для анализа временных рядов, особенно если у вас есть высокочастотные колебания в данных. Это позволит выделить важные характеристики сигналов, которые могут быть затем использованы для кластеризации.

  • Использование автоэнкодеров: Автоэнкодеры могут помочь в сжатии информации о временных рядах в менее размерные и более структурированные представления. Это может быть полезно для уменьшения шумов и выделения главных паттернов, которые можно анализировать для кластеризации.

2. Разделение на кластеры по дням

Разделение кластеризации на будние и выходные дни может быть хорошей идеей, особенно если предполагается значительная разница в паттернах использования. Вы можете использовать такие критерии:

  • Сезонность: Разделение по сезонам может выявить изменения в поведении потребления GN2 в разные времена года (например, зимние месяцы могут требовать больше тепла, а значит, больше GN2).

  • Частота и время суток: Также стоит рассмотреть возможность кластеризации по времени суток. Например, утренние и вечерние паттерны могут значительно отличаться.

3. Включение внешних переменных

Для более эффективного включения внешних переменных, таких как температура и влажность, попробуйте:

  • Мультивариантный анализ: Используйте мультивариантные методы анализа и модели, например, регрессионные модели с внешними переменными. Это позволит вам увидеть, как изменения температуры и влажности влияют на потребление GN2.

  • Составление признаков: Извлеките функциональные признаки из внешних переменных (например, среднее, максимум, минимум за день или использовав скользящие окна). Это может создать более полное представление о том, как внешние условия влияют на потребление.

4. Прогнозирование использования

Чтобы точнее предсказать использование GN2, вам может понадобиться:

  • Машинное обучение: Рассмотрите возможность применения моделей машинного обучения, таких как градиентный бустинг или метод случайного леса, с использованием кластеризованных паттернов и внешних факторов как предикторов.

  • Инструменты для предсказания: Используйте подходы, такие как Prophet от Facebook или другие инструменты для прогнозирования временных рядов, которые могут правильно учитывать сезонные и трендовые компоненты.

Заключение

Каждый из этих подходов может помочь улучшить вашу модель анализа и предсказания потребления GN2. Оптимальный подход может включать комбинацию нескольких методов.

Я надеюсь, что эти рекомендации окажутся полезными в вашем проекте. Если у вас появятся дополнительные вопросы или потребуется больше разъяснений по каким-либо из предложенных методов, не стесняйтесь обращаться!

Удачи в вашем проекте!

Оцените материал
Добавить комментарий

Капча загружается...