Вопрос или проблема
У меня есть две временные серии, демонстрирующие эволюцию количества опубликованных статей в Pubmed: общее количество статей и количество статей, содержащих «святой грааль» в тексте.
Я хочу проверить гипотезу о том, будет ли количество токенов «святой грааль» расти теми же темпами, что и общее количество статей, так что доля этих статей к общему количеству будет постоянной. Какой лучший способ это проверить?
Вы можете попробовать реализовать модель VAR. Статистическая модель, называемая векторной авторегрессией (VAR), используется для отображения взаимосвязи между различными величинами по мере их изменения во времени. С помощью этой модели вы сможете определить, связаны ли токены «святой грааль» с общим количеством статей и наоборот.
Ответ или решение
Чтобы проверить гипотезу о стационарности роста для количества упоминаний термина «holy grail» в тканях научных публикаций по сравнению с общим количеством статей, мы можем рассмотреть несколько подходов.
-
Анализ временных рядов: Прежде всего, вам потребуется проверить стационарность обоих временных рядов. Стационарность означает, что статистические свойства ряда (такие как среднее и дисперсия) не меняются со временем. Для проверки стационарности можно использовать тесты, например, тест Дики-Фуллера (ADF) или тест KPSS. Если хотя бы один из рядов не стационарен, его необходимо сделать стационарным, что можно сделать с помощью разностного преобразования.
-
Коэффициент эластичности: Для оценки того, будет ли рост упоминаний «holy grail» пропорционален общему количеству статей, можно рассмотреть коэффициент эластичности. Это позволяет вам оценить, насколько процентное изменение в количестве публикаций влияет на процентное изменение в упоминаниях.
-
Модель векторной авторегрессии (VAR): Как было предложено, вы можете использовать VAR для моделирования взаимосвязи между двумя временными рядами. Эта модель поможет вам понять, есть ли взаимное влияние между общим количеством публикаций и количеством упоминаний термина «holy grail». Вы сможете оценить, сохраняется ли пропорция этих величин во времени.
-
Коинтеграция: Если оба временных ряда стационарны после разностного преобразования, имеет смысл проверить наличие коинтеграции. Тест на коинтеграцию поможет выяснить, существует ли долгосрочная равновесная связь между обоими рядами. Если они коинтегрированы, это может указывать на то, что соотношение между количеством упоминаний «holy grail» и общим количеством публикаций стабильно во времени.
-
Регрессия: Также можно рассмотреть возможность построения регрессионной модели, где количество публикаций с «holy grail» будет зависимой переменной, а общее количество публикаций — независимой. Это даст вам возможность оценить, насколько точно количество упоминаний «holy grail» можно предсказать на основе общего количество статей.
Собрав все эти методы в единый подход, вы сможете тщательно исследовать гипотезу о стационарности роста и сделать выводы о долгосрочных тенденциях в упоминаниях термина «holy grail» в научной литературе.