Анализ выживаемости: псевдо-наблюдение против стратифицированной регрессии Кокса. Что лучше?

Question 1

Я изучаю метод регрессии Кокса для анализа выживаемости в прогнозировании оттока. Регрессия Кокса позволит нам определить вероятность того, что абонент откажется от подписки после времени $t$, определяемого коэффициентом риска:

$$
h(t \lvert X_i ) = h_0(t)exp\big( \boldsymbol{\beta} ^T\boldsymbol{X}_{i} \big)
$$

Где

$h_0(t)$: Базовый риск – это априорная вероятность того, что любой клиент уйдет в момент времени t, когда все влияющие факторы равны 0.
$\boldsymbol{\beta} \in \mathbb{R}^D$: Экспонента каждого коэффициента дает нам отношение рисков. Эти коэффициенты должны оставаться постоянными относительно времени (предположение пропорциональности).
$\boldsymbol{X}\in \mathbb{R}^{N\times D}$: Набор из $N$ выборочных клиентов

Проблема: Предположение о пропорциональности рисков: Регрессия Кокса делает предположение, что отношение рисков остается постоянным во времени $t$. Например, для коварии $X_1$ = “пол”, допустим, $\beta_1=1.8$. На английском это означает, что мужчины-абоненты склонны покидать сервис на $80\%$ больше, чем женщины, после времени $t$. Однако эти $80\%$ должны сохраняться для любого времени $t$.

Обычно это необоснованное ограничение для многих переменных. Но существуют и другие методы, которые могут включать переменные, не следующие предположению о пропорциональности рисков.

стратифицированная регрессия Кокса
псевдонаблюдения
регрессия Кокса с временно-зависимыми ковариатами

Я как раз читал о стратифицированной регрессии Кокса. Единственный явный недостаток здесь:

Переменные, которые стратифицированы, нужно преобразовать в категориальные переменные
Стратифицированные категориальные переменные не должны иметь слишком много степеней свободы. Это приведет к большому количеству моделей, для которых нужно оценить параметры.

Вопрос: Похожи ли псевдонаблюдения? Имеют ли они менее/более жесткие ограничения? Какова их производительность, учитывая, что у меня много данных?

Question 2

Я предлагаю использовать модель с более мягкими предположениями о пропорциональности рисков. В моей работе я использую модель с кусочной постоянной интенсивностью риска, которая работает великолепно. Ее предположение состоит в том, что риски пропорциональны в интервале времени. Она позволяет использовать числовые ковариаты со сплайнами и временно-зависимыми ковариатами. Более того, по моему опыту, модель обычно хорошо калибрована и редко переобучается.

Анализ выживаемости: псевдо-наблюдение против стратифицированной регрессии Кокса. Что лучше?

Вопрос или проблема

Ответ или решение