Становится ли с точки зрения статистики неправильно корректировать по полу и расе, а затем делать подгруппы на их основе в R?

Вопрос или проблема

Я хочу узнать ваше мнение:

Я провожу анализ подгрупп по ранней смертности (Результат), основанный на Переливании (С УЧЕТОМ как Пола, так и РАСЫ), и получил результаты, показывающие, что переливание ассоциировано с более высокой смертностью, в то время как в не скорректированной модели (после ИСКЛЮЧЕНИЯ Пола и расы из коррекции) и проведя анализ подгрупп на основе пола и расы, я получил более разумные результаты (показанные ниже: переливание ассоциировано с меньшим риском смертности). Я добавил результаты коллинеарности, используя vif, и коллинеарности не существует. Мне нужно знать, почему результаты изменились с учетом, так как это не имеет никакого клинического смысла – получать более низкую смертность в общей когорте и более высокую смертность в каждой подгруппе по полу.

Статистически неправильно корректировать по полу и расе, а затем делать подгруппу на их основе?

########## Рисунок 1. HR < 1 для переливания (некорректированный), так что мне интересно, почему HR > 1 после коррекции по полу и расе
library(Publish)
Publish::publish(E<-glm(Outcome ~   Transfusion, family = "binomial", data =di ),digits = 3)
# Переменная Единицы OddsRatio         CI.95  p-значение 
# Переливание     0       Ref                        
#                 1     0.880 [0.786;0.985]   0.0263 
sub_log <- subgroupAnalysis(E,di,treatment="Transfusion",
                            subgroups=~Sex+ RACE, factor.reference="inline"); sub_log  ;plot(sub_log)

########## Рисунок 2. HR > 1 после коррекции по полу и расе для переливания против отсутствия переливания в каждой подгруппе
Publish::publish(E<-glm(Outcome ~  Sex+ RACE + Transfusion, family = "binomial", data =di ),digits = 3); car::vif(E)
sub_log <- subgroupAnalysis(E,di,treatment="Transfusion",
                            subgroups=~Sex+ RACE, factor.reference="inline"); sub_log  ;plot(sub_log)

##########  Рисунок 3. Подробности моего датафрейма (большие данные)
table(di$Sex, di$RACE, di$Outcome, di$Transfusion)

Рисунок 1. HR < 1 для переливания, так что мне интересно, почему HR > 1 после коррекции по полу и расе

Рисунок 1 (некорректированный)

Рисунок 2. HR > 1 после коррекции по полу и расе для переливания против отсутствия переливания в каждой подгруппе
Рисунок 2 (скорректированный)

Рисунок 3. Подробности моего датафрейма (большие данные) таковы

Рисунок 3

Буду признателен за любой совет.

Ответ или решение

Обсуждая корректность статистической обработки данных, важно учитывать несколько аспектов, касающихся анализа подгрупп и корректировок по ключевым переменным, таким как пол и раса. Исходя из вашего запроса, мы рассмотрим, является ли статистически неправильным проводить коррекцию по полу и расе, а затем осуществлять анализ подгрупп основываясь на этих же переменных, а также возможные причины изменения результатов.

1. Процесс корректировки и его необходимость

Корректировка по половым и расовым признакам в статистических моделях выполняется для предотвращения смешивающих эффектов, которые могут исказить истинную взаимосвязь между переменными. Обычно такая коррекция позволяет получить более точные и объективные результаты. Однако имеются нюансы:

  • Смешивающие факторы: Пол и раса могут являться важными смешивающими факторами, но их влияние не всегда линейно. Это может привести к ситуациям, когда эффект трансфузии на смертность выглядит по-разному в зависимости от субгруппы.

2. Анализ зависимости от подгрупп

В вашем случае, когда вы первоначально не учитывали пол и расу (что дало вам отрицательный коэффициент для трансфузии), а затем добавили эти факторы и получили положительное значение, необходимо обратить внимание не только на данные, но и на модель.

  • Изменение результатов: Если результаты меняются при добавлении корректировок, это может означать существование взаимодействий между переменными. Показатель высшей смертости при трансфузии может указывать на то, что в определённых подгруппах (например, мужчины определённой расы) трансфузия может иметь более негативный эффект.

3. Взаимодействие переменных

Если между полом, расой и воздействием трансфузии есть взаимодействия, то важно их учитывать в модели. Вы можете попробовать следующий подход в своей модели:

E <- glm(Outcome ~ Sex * RACE + Transfusion, family = "binomial", data = di)

4. Разумность интерпретации результатов

На основании предоставленных вами данных, результаты могут показаться не интуитивно понятными, однако они возможны при взгляде на структуру данных:

  • Возможно, что трансфузия действительно имеет разные эффекты в зависимости от пола и расы. Это подчеркивает важность детального анализа подгрупп и наличия взаимодействий.

5. Итог

Статистически неправильно проводить коррекцию по полу и расе, а затем делать подгруппы по тем же переменным. Однако, в этом нет ошибки, если правильно учитывать взаимодействия и специфику данных.

Рекомендуется:

  • Провести анализ на наличие взаимодействий между переменными.
  • Рассмотреть возможность использования сложных моделей, которые могут учитывать такие взаимодействия.
  • Реально оценить значимость и клиническую интерпретацию полученных результатов.

Важно, чтобы любые выводы основывались не только на статистических данных, но и на клиническом опыте и логике.

Оцените материал
Добавить комментарий

Капча загружается...