Вопрос или проблема
Я хочу узнать ваше мнение:
Я провожу анализ подгрупп по ранней смертности (Результат
), основанный на Переливании
(С УЧЕТОМ как Пола
, так и РАСЫ
), и получил результаты, показывающие, что переливание ассоциировано с более высокой смертностью, в то время как в не скорректированной модели (после ИСКЛЮЧЕНИЯ Пола и расы из коррекции) и проведя анализ подгрупп на основе пола и расы, я получил более разумные результаты (показанные ниже: переливание ассоциировано с меньшим риском смертности). Я добавил результаты коллинеарности, используя vif
, и коллинеарности не существует. Мне нужно знать, почему результаты изменились с учетом, так как это не имеет никакого клинического смысла – получать более низкую смертность в общей когорте и более высокую смертность в каждой подгруппе по полу.
Статистически неправильно корректировать по полу и расе, а затем делать подгруппу на их основе?
########## Рисунок 1. HR < 1 для переливания (некорректированный), так что мне интересно, почему HR > 1 после коррекции по полу и расе
library(Publish)
Publish::publish(E<-glm(Outcome ~ Transfusion, family = "binomial", data =di ),digits = 3)
# Переменная Единицы OddsRatio CI.95 p-значение
# Переливание 0 Ref
# 1 0.880 [0.786;0.985] 0.0263
sub_log <- subgroupAnalysis(E,di,treatment="Transfusion",
subgroups=~Sex+ RACE, factor.reference="inline"); sub_log ;plot(sub_log)
########## Рисунок 2. HR > 1 после коррекции по полу и расе для переливания против отсутствия переливания в каждой подгруппе
Publish::publish(E<-glm(Outcome ~ Sex+ RACE + Transfusion, family = "binomial", data =di ),digits = 3); car::vif(E)
sub_log <- subgroupAnalysis(E,di,treatment="Transfusion",
subgroups=~Sex+ RACE, factor.reference="inline"); sub_log ;plot(sub_log)
########## Рисунок 3. Подробности моего датафрейма (большие данные)
table(di$Sex, di$RACE, di$Outcome, di$Transfusion)
Рисунок 1. HR < 1 для переливания, так что мне интересно, почему HR > 1 после коррекции по полу и расе
Рисунок 2. HR > 1 после коррекции по полу и расе для переливания против отсутствия переливания в каждой подгруппе
Рисунок 3. Подробности моего датафрейма (большие данные) таковы
Буду признателен за любой совет.
Ответ или решение
Обсуждая корректность статистической обработки данных, важно учитывать несколько аспектов, касающихся анализа подгрупп и корректировок по ключевым переменным, таким как пол и раса. Исходя из вашего запроса, мы рассмотрим, является ли статистически неправильным проводить коррекцию по полу и расе, а затем осуществлять анализ подгрупп основываясь на этих же переменных, а также возможные причины изменения результатов.
1. Процесс корректировки и его необходимость
Корректировка по половым и расовым признакам в статистических моделях выполняется для предотвращения смешивающих эффектов, которые могут исказить истинную взаимосвязь между переменными. Обычно такая коррекция позволяет получить более точные и объективные результаты. Однако имеются нюансы:
- Смешивающие факторы: Пол и раса могут являться важными смешивающими факторами, но их влияние не всегда линейно. Это может привести к ситуациям, когда эффект трансфузии на смертность выглядит по-разному в зависимости от субгруппы.
2. Анализ зависимости от подгрупп
В вашем случае, когда вы первоначально не учитывали пол и расу (что дало вам отрицательный коэффициент для трансфузии), а затем добавили эти факторы и получили положительное значение, необходимо обратить внимание не только на данные, но и на модель.
- Изменение результатов: Если результаты меняются при добавлении корректировок, это может означать существование взаимодействий между переменными. Показатель высшей смертости при трансфузии может указывать на то, что в определённых подгруппах (например, мужчины определённой расы) трансфузия может иметь более негативный эффект.
3. Взаимодействие переменных
Если между полом, расой и воздействием трансфузии есть взаимодействия, то важно их учитывать в модели. Вы можете попробовать следующий подход в своей модели:
E <- glm(Outcome ~ Sex * RACE + Transfusion, family = "binomial", data = di)
4. Разумность интерпретации результатов
На основании предоставленных вами данных, результаты могут показаться не интуитивно понятными, однако они возможны при взгляде на структуру данных:
- Возможно, что трансфузия действительно имеет разные эффекты в зависимости от пола и расы. Это подчеркивает важность детального анализа подгрупп и наличия взаимодействий.
5. Итог
Статистически неправильно проводить коррекцию по полу и расе, а затем делать подгруппы по тем же переменным. Однако, в этом нет ошибки, если правильно учитывать взаимодействия и специфику данных.
Рекомендуется:
- Провести анализ на наличие взаимодействий между переменными.
- Рассмотреть возможность использования сложных моделей, которые могут учитывать такие взаимодействия.
- Реально оценить значимость и клиническую интерпретацию полученных результатов.
Важно, чтобы любые выводы основывались не только на статистических данных, но и на клиническом опыте и логике.