Какие модели мне стоит попробовать для этой задачи?

Question 1

Мне нужно несколько советов по проблеме, над которой я работаю с автомобильными данными. Автомобили предоставляют серию кодов каждую секунду, которые сохраняются, хотя количество может варьироваться.

Например, на первом временном шаге автомобиль может отправить 3 кода:

(1, 2), (3, 5), (7, 9)

и количество временных шагов может варьироваться (до появления ошибки).

Теперь у некоторых из этих кодов есть связанные значения ошибок. Например, (1, 2) может быть критической ошибкой, обозначающей проблему с вашей шиной. Но подавляющее большинство из них не имеет этого. Таких критических ошибок около 15, в то время как других кодов 5500.

Коды на самом деле состоят из двух отдельных независимых кодов.

Задача состоит в том, чтобы предсказать заранее, вероятно ли появление любого из этих кодов.

Что я пробовал:

Я пытался сделать это с однослойной GRU RNN сетью с встраиваниями для всех кодов. Я прогнозирую вероятность следующего кода в последовательности на каждом шаге (считая каждый код шагом).

Я пробовал изменять параметры, такие как количество нейронов и т.д., но не получаю никаких результатов с этим (точность менее 5 процентов после нескольких эпох).

Как я могу улучшить эту модель?
Есть ли какой-либо метод, с помощью которого я могу рассматривать все эти коды на каждом шаге?
Какие другие алгоритмы, помимо глубокого обучения, я могу здесь применить?

Заранее спасибо

Question 2

Если я правильно понимаю, вы сейчас пытаетесь предсказать следующий код из 5500 возможных. Думаю, это слишком много вариантов для выбора, нельзя ожидать хорошей производительности в этом случае.

Поскольку задача заключается в предсказании 15 кодов ошибок, я бы представил проблему как задачу маркировки последовательности: метка на каждом шаге — это либо «ничего» (часто представляется как “_” в задачах маркировки последовательности), либо один из 15 кодов ошибок. Метка будет представлять наиболее вероятный исход для следующего шага, а не для текущего. Таким образом, система может использовать историю кодов (обычные характеристики) без необходимости предсказывать все из них, только критические. Обратите внимание, что если несколько кодов ошибок могут произойти одновременно, возможно, вам придется выбрать один как метку (может быть, их можно ранжировать по приоритету?).

Насколько я знаю, стандартным методом для маркировки последовательностей является Условное случайное поле (CRF). В традиционном подходе вам придется провести некоторую инженерную работу с признаками: например, пытаться не только давать коды как признаки, но и такие признаки, как частота появления кода за последние N шагов. Думаю, современный подход состоит в обучении RNN и использовании векторного представления в качестве признаков для CRF, но я могу быть не в курсе последней информации по этому вопросу.

Какие модели мне стоит попробовать для этой задачи?

Вопрос или проблема

Ответ или решение