Тест Кокрана-Мантеля-Хензеля с использованием взвешенных данных

Вопрос или проблема

Я провожу анализ методов контроля рождаемости, используемых после родов, и амбивалентности беременности. Для анализа я использую данные PRAMS, которые взвешены и стратифицированы по расе/этнической принадлежности. Все, что я читал, указывает на то, что мне нужно использовать CMH вместо обычного критерия хи-квадрат. Поскольку данные взвешены, я в основном использую PROC CROSSTAB или PROC SURVEYFREQ. Мой обычный метод — PROC CROSSTAB, который использует SUDAAN, вызываемый через SAS. Я сталкиваюсь с несколькими проблемами при проведении CMH в SUDAAN. Первая проблема, с которой я сталкиваюсь, — это вывод. При выполнении CMH-теста с использованием PROC CROSSTAB лучшая практика — сообщать об OR, однако вывод не дает отношения шансов, только взвешенные частоты и доверительные интервалы. Затем я попробовал использовать PROC SURVEYFREQ, но эта процедура не поддерживает CMH, поэтому я не знаю, что делать в данной ситуации. Может кто-нибудь порекомендовать мне ресурсы по коду SUDAAN, которые показывают, как получить OR, или объяснить, что я делаю неправильно? Я буду очень признателен.

Ответ или решение

Когда мы сталкиваемся с анализом данных, особенно таких специфических и комплексных, как данные PRAMS, содержащие информацию о методах контрацепции после родов и амбивалентность беременности, необходимо учитывать множество аспектов. Одним из таких аспектов является корректное использование статистических методов, подходящих для работы со взвешенными и стратифицированными данными. В этом контексте, Кокран-Мантел-Хэнзел (КМХ) тест служит важным инструментом, позволяющим учитывать смешенные факторы, особенно когда данные стратифицированы по расовой или этнической принадлежности.

Теория:

Тест Кокрана-Мантела-Хэнзела предназначен для анализа таблиц сопряженности, где необходимо учитывать влияние третьих переменных (стратифицирующих переменных). Это помогает устранить влияние потенциальных смешивающих факторов, которые могут исказить результаты, если учитывать только общее распределение данных без учета стратификации.

Для данных, взвешенных и стратифицированных, ключевой задачей является применение методов, которые могут корректно учитывать эту сложность. PROC CROSSTAB в SUDAAN является мощным инструментом для анализа подобных данных, однако, как вы заметили, он, возможно, не предоставляет все необходимые результаты (например, отношения шансов) в удобной форме.

Пример:

Предположим, вы анализируете эффект различной контрацепции, используемой различными этническими группами после родов, и желаете определить, есть ли значительная амбивалентность в зависимости от иного контрацептивного метода, с учетом этнической принадлежности. При этом каждый момент необходимо учитывать взвешенные наблюдения, которые репрезентативны для общей популяции.

Применение:

  1. Использование PROC CROSSTAB и получение OR:

    • Хотя PROC CROSSTAB предоставляет взвешенные частоты и доверительные интервалы, для извлечения отношений шансов (OR) может потребоваться дополнительная обработка данных. Некоторые специалисты создают дополнительные макросы или применяют постобработку результатов для вычисления необходимых OR.
    • Например, можно выгрузить исходные данные и использовать другие пакеты, такие как R, для вычисления OR, используя стандартные процедуры для подобных таблиц.
  2. Альтернативные подходы:

    • Несмотря на отсутствие прямой поддержки КМХ в PROC SURVEYFREQ, есть смысл изучить возможности создания промежуточных таблиц или матриц значений, которые можно использовать для дальнейшего анализа в других программах.
    • R или Python, например, предоставляют библиотеки, такие как survey в R, которая может поддерживать вычисление OR для взвешенных и стратифицированных данных.
  3. Обращение к документации и сообществам:

    • Подробная документация SUDAAN может содержать упоминания о специальных процедурах или рекомендациях, которые помогут обойти ограничение PROC CROSSTAB. Посещение специализированных форумов или профессиональных сообществ, таких как SAS community или форумы, посвященные эпидемиологии и статистике, может оказаться полезным для свежих решений и примеров кода.

Заключение:

Понимание и правильное использование КМХ теста для взвешенных данных требует учета всех особенностей используемых программных пакетов. Хотя текущие инструменты могут иметь ограничения, их можно обойти путем интеграции с другими решениями или дополнительной обработкой данных. Ваша задача — активное изучение документации и обмен опытом в профессиональных сообществах, что поможет найти подходящее решение для вашей специфической задачи анализа.

Оцените материал
Добавить комментарий

Капча загружается...