Оценка неопределенности регрессионных моделей

Question 1

Учитывая регрессионную модель с n признаками, как я могу измерить неопределенность или доверие к модели для каждого предсказания? Предположим, для конкретного предсказания точность потрясающая, но для другого – нет. Я хотел бы найти метрику, которая позволит мне решить, стоит ли “слышать” модель для каждого кадра.

Question 2

Это оценка, и она проводится экспериментально: с тестовым набором свежих экземпляров, содержащих истинное целевое значение, примените модель и измерьте ошибку для всех экземпляров (например, с помощью MAE, MSE, RMSE…).

Предполагая, что тест является достаточно большой представительной выборкой данных, таким образом можно оценить качество модели статистически. Например, мы можем сказать, что экземпляр в среднем предсказывается в диапазоне $x$ от истинного значения.

Но в общем невозможно знать, насколько хорошее предсказание для конкретного экземпляра: по определению модель дает свое наилучшее предсказание. Если бы модель была способна знать, что ее предсказание плохое, логически, она должна бы дать другое предсказание. Обратите внимание, что если бы это было возможно, также было бы возможно итеративно построить почти идеальную модель: пока предсказание плохое, пробуйте снова.

Для справки, есть некоторые специфические задачи, где пытаются оценить доверие к супервизорной модели (например, оценка качества MT). Это делается путем построения новой супервизорной модели для предсказания оценки доверия. Эта новая модель также может совершать ошибки, конечно.

Question 3

Чтобы ответить на мой вопрос, я использую три типа моделей –

Регрессия KNN
Регрессионные деревья
Сложные модели, такие как НН или SVM

Регрессия KNN

Это непараметрическая регрессионная модель, и доверие может быть явно смоделировано с использованием средней абсолютной ошибки или средней квадратной ошибки. В момент тестирования для данного экземпляра будут найдены K ближайших экземпляров, и в зависимости от их средней дистанции до данного экземпляра, мы можем вычислить среднюю абсолютную ошибку или среднюю квадратную ошибку. Мы можем оценить доверие, используя эти метрики. Более высокая средняя абсолютная ошибка или средняя квадратная ошибка приведет к более низкому значению доверия и наоборот.

Регрессионные деревья

При построении дерева во время обучения мы создаем листовые узлы, присваивая средней целевое значение связанных экземпляров узлу. При этом мы также можем присваивать и поддерживать среднюю среднюю абсолютную ошибку или среднюю квадратную ошибку между средней целевым значением и целевыми значениями связанных экземпляров узла. Похожие на вычисление стандартного отклонения целевых значений экземпляров этого узла. Таким образом, в момент тестирования для данного экземпляра, когда дерево достигает конкретного листового узла, вместе с регрессионным целевым значением мы также получим среднюю абсолютную ошибку или среднюю квадратную ошибку, которую мы можем ожидать для экземпляров, которые заканчиваются на этих узлах. И как объяснено в регрессии KNN, мы можем соответственно смоделировать доверие.

Сложные модели, такие как НН или SVM

Эти простые техники, обсуждаемые выше, также можно применить к этим моделям. Так же как и регрессия KNN, в момент тестирования для тестового экземпляра мы можем найти ближайшие K экземпляров из обучающего набора и вычислить среднюю абсолютную ошибку или среднюю квадратную ошибку, чтобы получить оценочное доверие. Но здесь можно сделать гораздо больше. Вы можете прочитать больше по этой теме (https://stats.stackexchange.com/questions/247551/how-to-determine-the-confidence-of-a-neural-network-prediction), где люди обсуждают что-то очень похожее, что вы можете найти полезным.

Оценка неопределенности регрессионных моделей

Вопрос или проблема

Ответ или решение

Оценка неопределенности регрессионных моделей

KNN-регрессия

Регрессионные деревья

Сложные модели: нейронные сети и опорные векторы

Заключение