Вопрос или проблема
Предположим, я владею магазином, который продает разнообразные яблоки, и у меня есть следующие данные за каждый месяц.
- Дата отчета
- Тип яблок (ТА)
- Количество в наличии (QA)
- Количество проданных за последние 30 дней (QS30)
- Количество в пути (QSI)
- Количество, необходимое для заказа (QN)
Сделаем следующие предположения/данные:
-
Есть три типа яблок: красные яблоки, зеленые яблоки и желтые яблоки.
-
T(1) обозначает первый месяц, а T(60) обозначает 60-й месяц.
-
QA @ T(i + 1) = QA@T(i) + QSI@T(i) – QS30@T(i+1)
Я могу предоставить все данные с T1-60 для каждого яблока.
Я также могу предоставить все данные для T61, кроме QN для каждого яблока.
Моя цель – предсказать QN на T61, или 61 месяц для каждого яблока.
Если меня интересуют только красные яблоки, я могу использовать ARIMAX с данными, касающимися только красных яблок, или VAR, верно?
Но что, если я вдруг введу новый тип яблок, например, оранжевые яблоки, и у меня есть история только с T1-4?
Учитывая, что мне нужно использовать T1-4 для оранжевых яблок…
Возможно ли использовать другие данные о красных, зеленых и желтых яблоках, чтобы правильно рассчитать значение QN для оранжевых яблок на T5?
Если меня интересуют только красные яблоки, я могу использовать ARIMAX с данными, касающимися только красных яблок, или VAR, верно?
Да, это возможно, вы потеряете информацию (возможно, ценную), но вы можете работать с ней.
Но что, если я вдруг введу новый тип яблок, например, оранжевые яблоки, и у меня есть история только с T1-4?
Учитывая, что мне нужно использовать T1-4 для оранжевых яблок… Возможно ли использовать другие данные о красных, зеленых и желтых яблоках, чтобы правильно рассчитать значение QN для оранжевых яблок на T5?
Вы будете ограничены знаниями об оранжевых яблоках, но другие переменные могут помочь вам получить достаточно информации до тех пор, пока вы не создадите более надежную модель, 4 записи могут быть недостаточными, но модель может помочь вам получить оценку.
Ответ или решение
В вашей ситуации прогнозирование временных рядов для различных типов яблок, таких как красные, зеленые и желтые, может быть выполнено с использованием методов, которые учитывают корреляции и взаимодействия между данными каждой категории. Это особенно актуально, если данные для новой категории, таких как оранжевые яблоки, ограничены.
Возможности прогнозирования:
-
Использование метода ARIMAX:
Если вы сосредоточены только на красных яблоках, ARIMAX может быть достаточным для моделирования количеств, учитывая входные переменные, такие как количество отгружаемого товара или проданного товара за последние 30 дней. Однако этот метод игнорирует возможные воздействия других типов яблок. -
Векторная авторегрессия (VAR):
Если вы заинтересованы в учете взаимодействий между разными видами яблок, VAR может предложить более комплексное решение. Этот метод позволяет моделировать взаимоотношения между всеми изменяющимися переменными, что может быть особенно полезно для анализа взаимодействий между различными типами яблок. -
Многоуровневый подход с использованием схожестей:
В случаях, когда данные оранжевых яблок ограничены (Т1-4), можно применить техники переноса обучения. Например, если у вас имеется более полная история для других типов яблок, можно использовать подходы анализа схожестей и переноса, чтобы инициализировать модель для оранжевых яблок с использованием общих паттернов от других видов. -
Машинное обучение и подходы на основе сходства:
Вы можете использовать модели машинного обучения, такие как нейронные сети, которые могут извлекать скрытые паттерны из общих данных. Техники, такие как кластеризация или использование признаков, могут помочь в извлечении полезной информации из данных других яблок для приложения к оранжевым. -
Регрессионный анализ с перекрестной временной привязкой:
Создание модели, способной извлекать информацию из временных рядов всех типов яблок одновременно, потенциально может повысить точность прогноза для новых типов, учитывая корреляции между данными.
Заключение:
Если у вас есть доступ к данным о продажах и запасах для всех типов яблок, комплексный подход, учитывающий временные зависимости и взаимосвязи между разными типами, может оказаться наиболее эффективным. Каждый из предложенных подходов может предложить ценную информацию в контексте ограничения данных. Важно помнить, что любой прогноз будет иметь определенную степень неопределенности, особенно в случае с ограниченными историями данных для нового продукта, такого как оранжевые яблоки.
Внедрение и тестирование различных моделей и подходов позволит оптимизировать и улучшить точность прогнозов в будущем.