Вопрос или проблема
Для проблем, связанных со временем, например, для предсказания акций:
Предположим, у нас есть 300 дней данных, 10 признаков и одна целевая переменная: цена.
Почему для тренировки нам нужна только цена 300-го дня?
Я знаю, что так работают модели LSTM, но разве не было бы полезно учитывать цену 299 других дней для модели?
Анализ временных рядов имеет две основные цели:
- Определить природу явления, представленного последовательностью наблюдений, и
- Прогнозировать (предсказывать будущие значения переменной).
ПРИМЕЧАНИЕ: В этом отношении модели пытаются выявить паттерны, используя исторические значения. Не путайте здесь прогнозирование (предсказание будущих значений) и предсказание.
Для задач предсказания временных рядов (прогнозирования) модели (ARIMA, LSTM) пытаются извлечь тренд, сезонность и остатки из списка исторических значений, например, цены за 300 исторических дат или времени. Поэтому здесь нет необходимости искать зависимые переменные.
Нужно понимать, алгоритмы прогнозирования временных рядов экстраполируют исторический тренд в ближайшее и дальнее будущее. Они не предсказывают целевую переменную на основе зависимых переменных. Это главная причина, по которой вы увидите, что модели временных рядов работают только с одной переменной, исторические данные которой становятся входными, а будущие точки данных становятся целевыми.
Ссылка:
Похоже, вы не понимаете, в чем разница между признаком и меткой.
Ваша метка — это ‘золотой’ результат, который вы пытаетесь предсказать. В предсказании акций это часто одно число, т.е. какая-то форма регрессии. Для данного временного ряда вы пытаетесь предсказать цену в будущем.
То, что вы предлагаете, вполне возможно и в основном именно так работает (линейная) регрессия: исходя из 300 точек данных, создается функция, которая подходит под эти данные. Затем получать значение из функции для данного x
. LSTM и другие архитектуры, безусловно, более сложные, но идея схожая.
Вы могли бы, например, подавать цены каждого временного штампа в качестве признака для LSTM. Это должно быть мощным предсказателем. Нейронная сеть попытается выяснить, какие признаки важны на каком этапе времени.
Ответ или решение
LSTM (Long Short-Term Memory) модели предназначены для обработки последовательностей данных, что делает их особенно подходящими для задач временных рядов, таких как прогнозирование цен акций. В рамках этих задач существует ключевая особенность: для успешного обучения модели не обязательно иметь метки для каждой временной точки.
Основные Причины Для Отсутствия Меток На Каждую Шаг Времени
-
Принцип Временных Рядов: В отличие от других типов задач машинного обучения, где метки требуются для каждого примера обучения, в задачах прогнозирования временных рядов модели исследуют тренды и сезонные изменения, используя исторические данные. Модель может извлекать необходимые зависимости и паттерны из предыдущих наблюдений, обращая внимание на их состояние в историческом контексте.
-
Скользящие Окна: Обычно процесс подготовки данных включает использование так называемых "скользящих окон". Например, чтобы предсказать значение в определенный момент времени (например, цену на 300-й день), можно использовать данные состояний (например, цены) за предшествующие дни (1–299 день). Это позволяет LSTM модели фокусироваться на последовательности данных и выявлять закономерности, без необходимости в иметь метки для каждого дня.
-
Целевая Переменная: Как правило, в задачах временного ряда, целевой переменной является цена, которую мы пытаемся предсказать. Метка (целевая переменная) представляет собой единственный результат, который следует прогнозировать на определенный временной шаг. Например, для предсказания 300-го дня модель может использовать 299 предыдущих дней, чтобы оценить, каким образом ценовая динамика приведет к определенному заключению. Вместо того, чтобы рассматривать все прежние дни как отдельные метки, LSTM обрабатывает их как контекст для одного прогноза.
-
Заблуждение о Зависимости: Временные ряды не всегда требуют присутствия независимых переменных. Многие (включая LSTM) модели фактически орентированы на одну (или несколько) временных последовательностей, где исторические данные всех значений времени непосредственно влияют на предсказание следующего значения. Следовательно, нет необходимости в дополнительных независимых переменных: зависимость полностью формируется из самой последовательности.
Заключение
Использование LSTM в задачах временных рядов связано с их способностью изучать временные зависимости и делать предсказания на основе скользящих окон исторических данных. Модель предназначена для того, чтобы извлекать относящиеся зависимости не из многогранных меток на каждом шаге, а из самих временных рядов. Это делает временные ряды уникальными по сравнению с другими задачами машинного обучения, где важно учитывать каждую метку как отдельную точку данных.
Для успешного прогнозирования времени важно правильно подготовить данные и предоставить соответствующие исторические последовательности, что позволяет LSTM модели изучать и предсказывать будущие значения на основе изученных паттернов.