Вопрос или проблема
Я работаю с временным рядом. Следует ли использовать и разностное преобразование, и нормализацию, или только одно из них, чтобы сделать ряд стационарным?
Нормализация не делает временной ряд стационарным, поскольку, по определению, нестационарный процесс имеет времезависимые безусловные совместные вероятностные распределения – это означает, что среднее и дисперсия меняются со временем.
Чтобы убедиться в этом, попробуйте вычислить среднее и стандартное отклонение, а затем нормализовать первую половину временного ряда. Сохраните эти оценки и преобразуйте оставшуюся половину, и в результате временной ряд останется нестационарным.
Разностное преобразование $K$ раз — это общий метод стационирования временных рядов, если он интегрирован порядка K, $I(K)$, и обычно работает на практике. Однако учтите, что стационарность подразумевает $I(0)$, но обратное не обязательно истинно.
Ответ или решение
Для решения задачи станционирования временного ряда, важно понимать два ключевых метода: нормализация и дифференцирование. Оба метода имеют свои особенности и служат разным целям в анализе данных.
Нормализация
Нормализация — это процесс масштабирования данных, который делает различия в уровне значений внутри временного ряда более понятными. Основная цель нормализации — привести данные к единой шкале без разрыва пропорциональности. Это особенно полезно при применении алгоритмов машинного обучения, где может возникнуть потребность в одинаковом масштабе данных. Однако, нормализация не делает временной ряд стационарным, поскольку она не устраняет временную зависимость и не стабилизирует изменяющиеся средние и дисперсии.
Пример работы нормализации: если набор данных имеет изменяющийся тренд или сезонность, нормализация только подчеркивает различия внутри заданного диапазона. Она не устраняет такие нарушения стационарности, как тренд и сезонные эффекты.
Дифференцирование
Дифференцирование — это метод, который делает временной ряд стационарным, устраняя тренды и другие нестабильности. Процесс предполагает вычитание предыдущего значения наблюдения из текущего значения. Когда временной ряд дифференцирован ровно столько раз, сколько необходимо для достижения стационарности, ряд становится интегрированным порядка K ((I(K))).
Применение в модели
-
Дифференцирование: Применяется для устранения нелинейностей и трендов. Рекомендуется начать с простого первого разности ((d=1)) и при необходимости углублять до второго или третьего порядка.
-
Проверка станционарности: После каждого шага дифференцирования нужно проводить тесты, такие как тест Дики-Фуллера, чтобы убедиться в достижении станционарности.
-
Нормализация на этапе моделирования: Хотя нормализация не делает данные стационарными, она будет полезной в процессе дальнейшего моделирования, особенно если планируется внедрение алгоритмов машинного обучения. Применить нормализацию можно после обработки на уровне стационарности для улучшения качества состояния модели.
Заключение
Исходя из вашей задачи, приоритет отдается дифференцированию для достижения стационарности. Нормализацию следует рассматривать как процессуальный шаг для улучшения работы моделей, но не как метод обеспечения станционарности. Подходите к данным с аналитическим мышлением и тестируйте каждый этап для достижения наилучшего результата.