P-значение с использованием гауссовского дискриминантного анализа

Question 1

Я задумался, в модели Гауссовского дискриминантного анализа (GDA), скажем, у нас есть два класса для классификации y=0 и y=1

После подгонки гауссианы по наборам данных y=0 и y=1, когда мы пытаемся предсказать класс для новой тестовой точки, говорится, что используется правило Байеса для расчета P(Y=0/1 | X) и назначается класс с максимальной вероятностью.

Мой вопрос: можем ли мы использовать p-значение вместо правила Байеса, чтобы проверить, принадлежит ли новая точка данных к y=0 или y=1, поскольку распределение, которое мы подгоняем, является гауссовым.

Таким образом, p-значение будет показывать вероятность увидеть тестовую точку данных для обоих гауссов (для класса y=0, y=1)

Так правильно ли я понимаю и можем ли мы использовать p-значение вместо правила Байеса?

Question 2

Здесь есть важный момент. Вы говорите:

Таким образом, p-значение будет показывать вероятность увидеть тестовую точку данных для обоих гауссов (для класса y=0, y=1)

Так правильно ли я понимаю и можем ли мы использовать p-значение вместо правила Байеса?

Нет, p-значения не могут заменить правило Байеса в Гауссовском дискриминантном анализе (GDA), поскольку они не дают апостериорные вероятности, необходимые для классификации.

Чтобы понять почему, давайте уточним основное различие между тем, что предоставляет p-значение, и тем, что нам нужно для классификации. Обычно, делая статистические выводы, мы собираем данные, $\mathcal{D}$, и хотели бы определить вероятность, что гипотеза истинна, исходя из этих данных, выраженную как:

$$\mathcal{P}(\mathcal{H_0} \mid \mathcal{D})$$

Однако частотные процедуры дают нам нечто совершенно другое:

$$\mathcal{P}(\mathcal{D} \mid \mathcal{H_0})$$
которое представляет вероятность получения данных хотя бы столь же экстремальных, как наблюдаемые, при условии, что нулевая гипотеза $\mathcal{H_0}$ истинна. Это значение, p-значение, таким образом, является мерой экстремальности данных в рамках конкретного класса (например, $Y=0$ или $Y=1$) вместо указания на то, какой класс более вероятен, учитывая данные.

Это различие особенно важно в GDA, поскольку задачи классификации требуют апостериорных вероятностей, которые p-значения не обеспечивают. В GDA нам нужны апостериорные вероятности, $\mathcal{P}(Y = 0 \mid X)$ и $\mathcal{P}(Y = 1 \mid X)$, чтобы оценить вероятность каждого класса для новых данных. Эти вероятности учитывают как правдоподобие данных в рамках гауссовского распределения каждого класса, так и априорные вероятности. Правило Байеса объединяет эти элементы, позволяя нам назначить класс с наивысшей апостериорной вероятностью.

Используя правило Байеса, апостериорная вероятность для класса $Y=0$ при условии данных $X$ рассчитывается как:

$$
\mathcal{P}(Y=0 \mid X) = \frac{\mathcal{P}(X \mid Y=0) \, \mathcal{P}(Y=0)}{\mathcal{P}(X \mid Y=0) \, \mathcal{P}(Y=0) + \mathcal{P}(X \mid Y=1) \, \mathcal{P}(Y=1)}
$$

где:

$\mathcal{P}(X \mid Y=0)$ и $\mathcal{P}(X \mid Y=1)$ — это правдоподобия наблюдения $X$ при условии каждого класса, и
$\mathcal{P}(Y=0)$ и $\mathcal{P}(Y=1)$ — это априорные вероятности каждого класса.

Класс с наивысшей апостериорной вероятностью затем выбирается как предсказанный класс для $X$.

Использование только p-значений не достигает этой цели, поскольку они не учитывают относительные вероятности или априорные вероятности каждого класса. Вместо этого они указывают, насколько необычными будут данные в каждом классовом распределении, что не указывает на принадлежность к классу.

Подводя итог, в то время как p-значения отражают экстремальность данных в рамках данного распределения, правило Байеса необходимо в GDA для вычисления апостериорных вероятностей, необходимых для надежной классификации. Для дальнейшего чтения по этой теме смотрите фундаментальные работы, такие как Фишер (1925) и Нейман и Пирсон (1933).

Источники

Фишер, Р. А. (1925). Статистические методы для исследовательских работников. Оливер и Бойд.
Нейман, Я., & Пирсон, Е. С. (1933). Проблема наиболее эффективных тестов статистических гипотез. Философские транзакции Лондонского королевского общества. Серия A, содержащая статьи математического или физического характера, 231(694-706), 289–337.

P-значение с использованием гауссовского дискриминантного анализа

Вопрос или проблема

Ответ или решение

Основа анализа дискриминации Гаусса

Роль p-значения

Почему нельзя заменить правило Байеса p-значением

Заключение