Машинное обучение на основе нескольких временных рядов

Вопрос или проблема

У меня есть набор из 192 датчиков. Для измерения требуется 4 датчика (например, для измерения средней температуры между используемыми датчиками в сложном материале). Эти датчики распределены по определенному паттерну, чтобы получить информацию из всего материала.

У меня около 10 тыс. комбинаций этих 192 датчиков, что-то вроде

1,2,3,4, val_1
2,3,4,5, val_2,
....
13,10,1,192, val_x.

Существует некая связь между val_1 и val_2, так как они используют 3 общих датчика, которые относятся к примерно схожему пространству. То же касается всех остальных комбинаций, между всеми val_ существует сложная связь.

Теперь представьте, что все значения были собраны в одно и то же время. Это мой dataset1.

Я повторяю этот цикл измерений 2 тыс. раз (например, как временной ряд), соответственно собирая dataset2, dataset3, …datasetn.

То, как изменяется val_1 со временем, также связано с тем, как изменяется val_2 со временем. Другими словами, val_1 и val_2 связаны как в пространстве, так и во времени.

Что я ищу, так это алгоритм машинного обучения, который будет обучен на этих 2 тыс. временных наборов данных, чтобы найти связь между 10 тыс. комбинациями, так что будущие измерения будут использовать только подмножество из 10 тыс. комбинаций (например, сжатие данных).

Какой алгоритм машинного обучения может подойти?

Ответ или решение

Для решения вашей задачи, связанной с анализом данных, собранных с 192 сенсоров, предлагаю несколько подходов, которые могут быть полезны для выявления зависимости между измерениями как в пространственном, так и во временном контексте.

1. Подходы к обучению

a. Модели временных рядов

Используйте модели временных рядов, такие как ARIMA или SARIMA, для анализа собственных временных рядов значений (val_1, val_2 и т.д.). Эти модели хорошо работают с временными зависимостями и могут помочь выявить различные аспекты данных.

b. Многомерные временные ряды

Для одновременного учета нескольких временных рядов можно использовать такие модели, как VAR (векторная авторегрессия) или VARMA (векторная авторегрессионная модель со скользящим средним). Эти модели позволят учитывать взаимные влияния между всеми комбинациями значений.

2. Модели машинного обучения

a. Регрессионные методы

Используйте методы регрессии, такие как линейная регрессия или регрессионные деревья решений (например, Random Forest Regression) для определения зависимости между различными комбинациями сенсоров. Вам нужно будет подготовить набор данных, где входные переменные – это комбинации сенсоров, а выходные – их соответствующие значения.

b. Нейронные сети

Глубокие нейронные сети, например, LSTM (долгая краткосрочная память) могут эффективно работать с временными рядами и обнаруживать сложные зависимости в данных. Используя LSTM для прогнозирования значений в будущем, вы сможете учитывать как пространственные, так и временные зависимости.

3. Выбор подмножества комбинаций

После того как модель будет обучена и протестирована, вы можете провести анализ важности признаков (feature importance), чтобы определить, какие из 10k комбинаций сенсоров наиболее значимы для прогнозирования значений. Это позволит вам сократить количество сенсоров, используемых в будущих измерениях, что, в свою очередь, будет являться «сжатием данных».

4. Дополнительные техники

  • Кластеризация: Применение методов кластеризации (например, K-средних) для группировки сенсоров на основе их схожести в отношении значений и временных изменений.
  • Снижение размерности: Используйте PCA (метод главных компонент) для уменьшения размерности вашего пространства, что может помочь выявить наиболее важные комбинации сенсоров.

Заключение

Объединение методов временных рядов, многомерной регрессии и глубоких нейронных сетей с анализом значимости признаков позволит вам эффективно использовать ваш богатый набор данных и получить модели, способные предсказывать значения с учетом пространственных и временных взаимосвязей. Таким образом, можно будет выбрать подмножество сенсоров для будущих измерений, обеспечивая при этом достаточный уровень точности и надежности.

Оцените материал
Добавить комментарий

Капча загружается...