Вопрос или проблема
У меня есть набор данных. Я хотел провести парный t-тест. Поэтому я выполнил тест на нормальность, который показал, что данные не следуют нормальному распределению. Поэтому я использовал тест Уилкоксона вместо парного t-теста. Описательная статистика моих данных показывает медианное значение 0, но когда я провел тест Уилкоксона, он дал мне p-значение <0.05, что указывает на необходимость отклонить нулевую гипотезу. Не могли бы вы объяснить, почему существует это несоответствие в результатах моего теста?
summary(Rel)
REL1. REL2. Diff
Min. :1.000 Min. :1.000 Min. :-5.0000
1st Qu.:7.000 1st Qu.:6.000 1st Qu.:-1.0000
Median :7.000 Median :7.000 Median : 0.0000
Mean :6.617 Mean :6.289 Mean :-0.3282
3rd Qu.:7.000 3rd Qu.:7.000 3rd Qu.: 0.0000
Max. :7.000 Max. :7.000 Max. : 3.0000
Тест знаковых рангов Уилкоксона
данные: REL1. и REL2.
V = 7993.5, p-значение = 2.449e-13
альтернативная гипотеза: истинный сдвиг положения не равен 0
Здесь есть несколько вопросов.
Вы говорите:
Я хотел провести парный t-тест. Поэтому я выполнил тест на нормальность, который показал, что данные не следуют нормальному распределению
Что именно вы тестировали и как вы это тестировали? Поскольку вопрос старше 3 лет, я не ожидаю ответа. В парном t-тесте не сами данные должны быть нормально распределены, а различия.
Далее, тест знаковых рангов Уилкоксона не проверяет, равно ли медианное различие нулю. Вместо этого он проверяет, является ли распределение различий симметричным относительно нуля. Другими словами, он проверяет, равен ли “сдвиг положения” различий нулю. Ненулевой результат указывает на то, что различия последовательно положительные или отрицательные среди ваших пар.
Хотя медиана различий в вашем случае равна нулю, тест Уилкоксона все равно может обнаружить значимый результат, если существует последовательный шаблон небольших, но ненулевых различий, которые тест агрегирует. Это означает, что даже если некоторые различия малы или равны нулю, если есть последовательный сдвиг в одном направлении, это может привести к статистически значимому результату.
Таким образом, должно быть ясно, что нет причины ожидать, что два теста приведут вас к одному и тому же заключению/решению, поскольку они проверяют разные вещи.
Ответ или решение
Для анализа несоответствия между результатами парного t-теста и теста Уилкоксона нужно учесть несколько ключевых моментов, касающихся методов и их интерпретации.
Контекст и Основания для Выбора Тестов
Вы упомянули, что при проверке нормальности данных был установлен факт, что данные не имеют нормального распределения. Это решение является основополагающим, так как парный t-тест предполагает, что разности между парами следуют нормальному распределению. Если данные не удовлетворяют этому условию, использование t-теста является неправомерным.
Вместо этого был использован тест Уилкоксона — непараметрический метод, который не требует нормальности и подходит для анализа распределений, которые не следуют нормальным законам.
Интерпретация Результатов
Теперь рассмотрим ваши результаты:
-
Парный t-тест не показал значимых различий между выборками, что может говорить о том, что в разностях между парами не наблюдается зафиксированных паттернов (например, разности не имеют выраженного расположения выше или ниже нуля).
-
Тест Уилкоксона с p-значением менее 0.05 указывает на то, что есть статистически значимое различие между парами. Это означает, что хотя разности в данных в среднем могут быть нулевыми (что подтверждается медианой), на самом деле, существует определенная асимметрия в распределении различий.
Почему Может Существовать Диспропорция
Фактически, тест Уилкоксона анализирует расположение (или сдвиг) различий, а не только их медиану. Если в ваших данных есть небольшие, но многочисленные положительные или отрицательные разности, тест Уилкоксона способен выявить эти паттерны. Например, если у вас есть много пар, где одно значение значительно превосходит другое, даже если в целом медиана разностей равна нулю, это может привести к статистически значимому результату.
Таким образом, даже с медианной разностью, равной нулю, тест Уилкоксона может регистрировать наличие истинного сдвига в распределении, который и вызывает статистическую значимость.
Заключение
Ваша ситуация подчеркивает важность понимания методов анализа данных. Поскольку парный t-тест и Уилкоксона тест нацелены на разные аспекты данных, нет ничего необычного в том, что их результаты могут различаться. Если вы превысили своё ожидание на основе медианы разностей, следует учитывать, что в дополнение к ней важен плато статистики: в распределении могут быть мелкие, но устойчивые сдвиги, которые тест Уилкоксона способен зафиксировать.
В будущем, если вам необходимо оптимально оптимизировать выбор тестов, рекомендую рассмотреть теоретические аспекты каждого теста и их условия применения, чтобы избежать подобных несоответствий.