Как установить параметры скрытой модели Маркова, которая будет использоваться для исправления ошибок предыдущего классификатора?

Question 1

Предположим, мы ранее использовали нейронную сеть или другой классификатор C с $N$ обучающими образцами $I:=\{I_1,…I_N\}$ (которые имеют последовательность или контекст, но игнорируются C), принадлежащими $K$ классам. Предположим, по какой-то причине (возможно, из-за проблемы с обучением или неправильного назначения классов) классификатор C запутался и не работает хорошо. Способ, которым мы назначаем класс к каждому тестовому образцу $I$ с использованием C, следующий: $class(I):= arg max _{ {1 \leq j \leq K} } p_j(I)$, где $p_j(I)$ — это оценка вероятности того, что $I$ принадлежит $j$-му классу, предоставляемая C.

Теперь, поверх этого классификатора C, я хотел бы использовать Скрытую Марковскую Модель (СММ) для “исправления” ошибок, сделанных предыдущим классификатором C, не учитывающим контекст, с учетом контекстной/последовательной информации, не используемой C.

Пусть в моем СММ скрытое состояние $Z_i$ обозначает истинный класс $i$-го образца $I_i$, а $X_i$ — предсказанный класс с помощью C. Мой вопрос: как можно использовать вероятностную информацию $cl(I):= arg max _{ {1 \leq j \leq K} } p_j(I)$ для обучения этой СММ? Я понимаю, что матрица замешательства C может быть использована для определения вероятности эмиссии СММ, но как мы определяем переходные и стартовые/априорные вероятности? Мне кажется, что стартовый/априорный вектор вероятностей можно определить как $\pi:=(p_1(x_1), …, p_K(x_1))$. Но я могу ошибаться. Это мой главный вопрос.

Вопрос по теме: Можно определить СММ описанным выше способом (с использованием матрицы замешательства и вероятностной информации от C); результатирующий набор параметров назвать $\Theta_0$. Но после этого, стоит ли оценивать параметры, чтобы они лучше соответствовали данным $I$, использованным для C, инициализируя набор параметров упомянутыми в предыдущем абзаце значениями?

Question 2

Насколько я знаю, вы не можете судить о скрытом классе, значение скрытого класса в момент времени t — это ‘некоторые промежуточные значения взвешенных значений всех скрытых классов’.

см. пункт – 2) последовательность скрытых состояний в блоге –
https://machinelearningstories.blogspot.com/2017/02/hidden-markov-model-session-1.html

поэтому ваше утверждение-

“Таким образом, пусть в моем СММ скрытое состояние Zi обозначает истинный класс $i$-го образца Ii, а Xi — предсказанный класс C- некорректно.

Как вы можете сравнить значение скрытого класса с фактическим, вы могли бы сравнить значение эмиссии и фактическое.

Вы можете попробовать ансамблирование СММ и Cs. Интересно, как именно вы пытаетесь использовать параметры из задачи классификации для временного ряда/последовательности (СММ).

Как установить параметры скрытой модели Маркова, которая будет использоваться для исправления ошибок предыдущего классификатора?

Вопрос или проблема

Ответ или решение