Насколько эффективен псевдообратный оператор Мура-Пенроуза для решения задач регрессии с переопределенной системой уравнений?

Question 1

Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач.

Насколько хорошо это “в общем” работает по сравнению с другими альтернативами, такими как гребневая регрессия/лассо, частичные наименьшие квадраты, регрессия по главным компонентам?

Также, при наличии наборов данных с предикторами > наблюдений, существует ли метод из перечисленных выше, который всегда показывает лучшие результаты по сравнению с другими (чисто с точки зрения точности предсказания)?

Question 2

Математические детали

1. Метод наименьших квадратов (МНК):

МНК решает задачу минимизации остаточной суммы квадратов:

$$
\hat{\beta} = \operatorname*{arg\,min}_{\beta} \| Y – X\beta \|^2
$$

где:

$Y \in \mathbb{R}^n$ — это вектор ответов,
$X \in \mathbb{R}^{n \times p}$ — это проектная матрица,
$\beta \in \mathbb{R}^p$ — это вектор коэффициентов.

Закрытое решение:

$$
\hat{\beta} = (X^T X)^{-1} X^T Y
$$

Однако прямой расчет $(X^T X)^{-1}$ часто неустойчив для плохо обусловленных матриц.

2. Псевдообратная матрица Мура-Пенроуза:

Псевдообратная матрица Мура-Пенроуза, $X^+$, вычисляется с использованием сингулярного разложения (SVD):

$$
X = U \Sigma V^T, \quad X^+ = V \Sigma^+ U^T
$$

где:

$U \in \mathbb{R}^{n \times n}$ и $V \in \mathbb{R}^{p \times p}$ — это ортогональные матрицы,
$\Sigma \in \mathbb{R}^{n \times p}$ — диагональная с сингулярными значениями,
$\Sigma^+$ содержит обратные значения ненулевых сингулярных значений.

Решение:

$$
\hat{\beta} = X^+ Y
$$

3. QR-разложение:

QR-разложение выражает проектную матрицу следующим образом:

$$
X = Q R
$$

где:

$Q \in \mathbb{R}^{n \times p}$ — ортогональна ($Q^T Q = I$),
$R \in \mathbb{R}^{p \times p}$ — верхняя треугольная.

Решение получается путем решения $R\beta = Q^T Y$ через обратную подстановку.

Сравнение

1. Числовая стабильность

Псевдообратная матрица (SVD): Устойчиво обрабатывает матрицы с недостатком ранга, фильтруя малые сингулярные значения, что делает ее подходящей для плохо обусловленных задач.
QR-разложение: Улучшает числовую стабильность, избегая прямого обращения матрицы $X^T X$, хотя в случаях недостатка ранга она менее устойчива, чем SVD.

2. Вычислительная эффективность

Псевдообратная матрица (SVD): Выматывающий по вычислительным затратам с сложностью $O(n p^2)$, подходит для малых и умеренных наборов данных.
QR-разложение: Также $O(n p^2)$, но быстрее на практике из-за меньших постоянных факторов, что делает его идеальным для больших наборов данных.

3. Практические соображения

Псевдообратная матрица: Предпочтительно использовать, когда проектная матрица имеет недостаток ранга или когда понимание сингулярных значений критично.
QR-разложение: Предпочтительно для стандартных переопределенных систем благодаря лучшему соотношению между скоростью и стабильностью.

Подводя итоги

Обе методики эффективны для решения задач МНК, но их пригодность зависит от контекста задачи:

Используйте псевдообратную матрицу Мура-Пенроуза для матриц с недостатком ранга или плохо обусловленных.
Выбирайте QR-разложение для задач регрессии большого масштаба, требующих вычислительной эффективности.

Ссылки

Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations. Johns Hopkins University Press.
Higham, N. J. (2002). Accuracy and Stability of Numerical Algorithms. SIAM.

Насколько эффективен псевдообратный оператор Мура-Пенроуза для решения задач регрессии с переопределенной системой уравнений?

Вопрос или проблема

Математические детали

Сравнение

Подводя итоги

Ссылки

Ответ или решение

Введение

1. Метод наименьших квадратов (OLS)

2. Псевдообратная матрица Мура-Пенроуза

3. Сравнение с другими методами

3.1. Числовая стабильность

3.2. Вычислительная эффективность

3.3. Практические соображения

4. Производительность различных методов

4.1. Какой метод лучше?

Заключение