В чем разница между сдвигом ковариат, сдвигом метки, сдвигом концепта, дрейфом концепта и сдвигом априорной вероятности?

Question 1

Как начинающему в MLOps, мне было трудно с некоторыми запутанными определениями.

Насколько я понимаю, когда у нас есть классификатор или регрессор с функцией y = f(X):

Covariate Shift означает изменение распределения независимых переменных (X),
Label Shift означает изменение распределения зависимых переменных (y),
Concept Shift или drift концепции означает изменение взаимосвязи между X и Y (f).

Но что такое Prior Probability Shift и Dataset Shift? Являются ли label shift и data drift синонимами этих двух предыдущих определений?

Правильно ли я понимаю, не мог бы кто-то уточнить мне различия между этими определениями? Я думаю, это можно сделать, приведя ясный пример.

Question 2

Я перефразирую из книги “Designing Machine Learning Systems by Chip Huyen”.

В задаче машинного обучения с обучением под контролем обучающая выборка может рассматриваться как набор образцов из совместного распределения P(X,Y), где X — это входные данные, а Y — это выходные данные. Мы заинтересованы в моделировании P(Y|X). P(X,Y) можно разложить как P(X|Y)*P(Y) или P(Y|X)*P(X). Понятие сдвига данных является общим термином, который иногда используется как синоним label shifts, covariate shifts и concept drift. Но эти сдвиги можно рассматривать как три отдельных подтипа сдвигов данных, и их определение связано с изменением параметров, таких как P(Y) или P(X).

Covariate shift: Когда P(X) изменяется, но P(Y|X) остается прежним. Это относится к первому разложению совместного распределения, т.е. распределение входных данных изменяется, но условная вероятность выхода при заданном входе остается прежней. Например, вы пытаетесь предсказать, будет ли человек неплатежеспособным или нет. У вас есть переменная education в вашей модели, и предположим, что люди с низким уровнем образования обычно чаще становятся неплатежеспособными. В вашем обучающем наборе данных предположим, у вас много примеров людей с более высоким уровнем образования, но в вашем наборе данных для тестирования много примеров людей с низким уровнем образования.

Label shift: Когда P(Y) изменяется, но P(X|Y) остается прежним. Это относится ко второму разложению совместного распределения. Это также известно как prior shift, prior probability shift или target shift. Давайте развивать тот же пример, предположим, что правительство начинает предоставлять прямые денежные трансферы всем людям, это может снизить вероятность неплатежеспособности P(Y) для всех, однако условная вероятность P(X|Y), т.е. вероятность того, что человек имеет более низкое образование, при условии, что он стал неплатежеспособным, не изменилась.

Concept drift: Когда P(Y|X) изменяется, но P(X) остается прежним. Это относится к первому разложению совместного распределения. Это также известно как posterior shift. Например, в модели предсказания цен на жилье площадь дома является входным параметром, предположим, до Covid-19 цена дома составляет 200K, но после Covid-19 цена дома снизилась до 150K. Таким образом, даже если характеристики дома остаются прежними, условное распределение цены дома, учитывая его характеристики, изменилось.

Существуют и другие типы изменений, которые не совсем являются сдвигами данных, но тесно связаны с изменением схемы данных. Предположим, вы добавляете новую характеристику в свою модель или меняете свойства конкретной характеристики (например, ранее характеристика, как разница во времени, моделировалась в днях, а теперь — в месяцах). Еще один пример — когда вы изменяете возможные значения, которые Y может принимать в задаче классификации (например, ранее в вашей задаче анализа настроений вы классифицировали только как POSITIVE и NEGATIVE, но теперь вам также нужно классифицировать как NEUTRAL).

Надеюсь, это поможет.

В чем разница между сдвигом ковариат, сдвигом метки, сдвигом концепта, дрейфом концепта и сдвигом априорной вероятности?

Вопрос или проблема

Ответ или решение

1. Ковариатный сдвиг (Covariate Shift)

2. Сдвиг меток (Label Shift)

3. Изменение концепции (Concept Shift / Concept Drift)

4. Сдвиг априорной вероятности (Prior Probability Shift)

5. Дрейф концепции (Concept Drift)

Заключение