Как обновить апостериорное убеждение, когда мы наблюдаем поток коррелированных данных из фиксированного, но неизвестного источника данных?

Question 1

Я хочу построить [вероятностную] модель, которая стремится вывести истинное значение неизвестной категориальной переменной, $y \in \{1,2,…, K\}$.

У нас есть набор данных $(X,y): \mathbb{R}^d\rightarrow \{1,2,…, K\}$, и мы можем обучить классификатор, который принимает $d$-мерные данные, $X$, и оценивает выход $y$.

Теперь предположим, что $X$ связаны и все получены из фиксированного $y$. Имеется в виду, что мы наблюдаем $X^1, X^2,…., X^T,…$ с течением времени и знаем, что $y$ фиксировано для всех них.

Например:

Мы получаем $X^1$ (в момент времени $t=1$) и наш предварительно обученный классификатор делает предположение о $\hat{y}^1$.
Затем мы получаем $X^2$, и снова используем классификатор для предположения $\hat{y}^2$.
Затем мы получаем $X^3$, и так далее.

Таким образом, в момент времени $t=T$ у нас есть $\hat{y}^1, \hat{y}^2, …, \hat{y}^T$.

Теперь вопрос: как я могу создать модель для использования этих оценок ($\hat{y}^1, \hat{y}^2, …, \hat{y}^T$) и улучшения моего представления о истинном $y$ с течением времени, учитывая, что:

размерность $d$ не мала. например, $d >50$
выборки данных, $X$, не i.i.d., но все получены из фиксированного неизвестного $y$.
классификатор не оптимален (просто обучен на некоторых доступных данных) и на каждом этапе дает оценку $\hat{y}^t$ для текущего $X^t$.

Я изучал некоторый материал и наткнулся на следующее, но не уверен, что из этого лучше исследовать подробнее:

Последовательное тестирование гипотез
Оптимальная остановка
Последовательный тест отношения вероятностей
Правило принятия решений HDI+ROPE: интервал высокой плотности (HDI) область практической эквивалентности (ROPE)

Или существует какая-то конкретная байесовская структура для этого?

Question 2

Я думаю, что все предложенные вами варианты дадут результаты для описанной вами задачи. Кажется, у вас есть что-то вроде игральной кости, которая дает результаты в виде набросков, все непредсказуемо, но все же связано с y, и вы хотите вывести y на основе значений x. Как
скрытая марковская модель.

Часть о желании точно оценить y при каждом x и о связях x заставляет меня верить, что технология LSTM может быть полезной, если вы хотите использовать НС.

Оптимальная остановка, последовательное тестирование гипотез, последовательный тест отношения вероятностей и HDI+ROPE все подойдут для описанной вами абстрактной задачи. Пока вы не предоставите нам больше деталей о вашей задаче, например, с чем именно вы будете работать, трудно дать точное направление.

Если вы создадите LSTM, которая принимает X и делает предположение о том, какой y, и обучите ее на имеющихся у вас данных x, тогда вы получите модель предсказания, которую ищете.

Как обновить апостериорное убеждение, когда мы наблюдаем поток коррелированных данных из фиксированного, но неизвестного источника данных?

Вопрос или проблема

Ответ или решение

Анализ условий задачи

Подходы и методы

1. Байесовский подход

2. Скрытые модели Маркова (HMM)

3. Рекуррентные нейронные сети (RNN) и LSTM

4. Sequential Probability Ratio Test (SPRT)

Заключение