Вопрос или проблема
Я создал модель прогнозирования гонок на мотоциклах, которая принимает пары гонщиков и выводит вероятность того, что каждый гонщик обгонит другого в каждом парном сравнении. Эта информация затем обрабатывается с использованием модели Бредли-Терри, чтобы определить вероятность победы каждого гонщика.
С этой информацией (парные вероятности и вероятности победы) как я могу рассчитать вероятность того, что каждый гонщик финиширует на n-ом месте?
Пока что я экспериментировал с методом Харвилла, который, как мне указали, имеет некоторые нереалистичные предположения. В настоящее время я работаю с методом на https://github.com/microprediction/winning, но я не совсем уверен, как вывести, чтобы определить вероятность того, что каждый гонщик финиширует на конкретной позиции.
Мне хотелось бы знать, есть ли что-то очевидное, что я могу сделать с информацией и моделями, которые я использую в настоящее время, и/или есть ли другие модели, на которые мне следует обратить внимание.
Большая благодарность Петру Коттону (https://math.stackexchange.com/users/92982/peter-cotton), Учитывая вероятность победы каждой лошади в гонке, какова вероятность того, что конкретная лошадь займёт 2-е и 3-е места?, URL (версия: 2021-09-10): https://math.stackexchange.com/q/3260483
Можно использовать систему рейтингов Эло для ранжирования игроков в соревновательных видах спорта. Эло присваивает очки за победы и поражения на основе частоты обыгрывания соперников, значение очков относительно силы соперников. Значения очков Эло могут быть преобразованы в порядковое / n-е предсказание.
Ответ или решение
Чтобы оценить вероятность каждого гонщика занять n-ю позицию в мотоциклетной гонке с использованием модели Бредли-Терри, вы можете использовать следующий подход, основанный на ваших текущих расчетах через парные вероятности и оценки побед.
1. Исходные данные и модели
Модель Бредли-Терри позволяет рассчитывать вероятность того, что один гонщик победит другого, основываясь на их относительных способностях. После того, как вы вычислили вероятности победы для каждой пары гонщиков, вы можете получить общую вероятность выигрыша для каждого гонщика.
2. Расчет вероятностей финиша на n-й позиции
Чтобы вычислить вероятность того, что определенный гонщик займет n-ю позицию, вы можете воспользоваться следующим методом:
a. Возможные комбинации финиширования:
Для того чтобы рассчитать вероятность финиша гонщика на n-й позиции, нужно учитывать все возможные комбинации, которые могут произойти на финише. Например, если у вас есть K гонщиков, и вы хотите узнать вероятность, что гонщик A займет n-ю позицию, вам нужно учитывать следующее:
- Гонщик A должен проиграть всем гонщикам, финишировавшим выше (1-му до (n-1)-го).
- Гонщик A должен победить всех гонщиков, которые финишируют ниже него (с (n+1)-го до K-го).
b. Вероятности для каждого случая:
Обозначим P(A > B) как вероятность, что гонщик A победит гонщика B. Тогда, учитывая независимость событий, вероятность гонщика A финишировать na n-й позиции может быть выражена следующим образом:
[
P(A \text{ занимает n-ю позицию}) = P(A \text{ проигрывает } (n-1) \text{ гонщикам}) \times P(A \text{ побеждает } (K-n) \text{ гонщиков})
]
Где
- ( P(A \text{ проигрывает } (n-1) \text{ гонщикам}) ) может быть вычислена как произведение вероятностей, что гонщик A проиграет каждому из (n-1) гонщиков.
- ( P(A \text{ побеждает } (K-n) \text{ гонщиков}) ) также может быть представлено как произведение вероятностей победы гонщика A над каждым из оставшихся K-n гонщиков.
c. Пример:
Если у вас есть 5 гонщиков и вам нужно вычислить вероятность гонщика A занять 3-е место, необходимо:
- Вычислить вероятность, что A проиграет гонщикам (например, B и C)
- Вычислить вероятность, что A победит гонщиков (например, D и E)
- Умножить полученные вероятности для получения общего результата.
3. Альтернативные модели и методы
Вы упомянули, что исследуете методы, такие как метод Харвила. Если вы заметили нерелевантные предположения, возможно, стоит рассмотреть следующие альтернативы:
- Методы на основе Монте-Карло: Симуляции могут выявить распределение финишных позиций с учетом случайных явлений в гонках.
- Модели машинного обучения: Использование подходов с учетом реальных данных о гонках для прогнозирования финиша на основе различных факторов.
- Система Эло: Как вы уже отметили, модификация системы Эло может быть продуктивной для расчета порядковых вероятностей.
4. Заключение
Используя модель Бредли-Терри, вы можете получить вероятность того, что каждый гонщик займет конкретную позицию. Важно учитывать все возможные комбинации и правильным образом агрегировать вероятности. Если вы столкнётесь с ограничениями актуальных методов, не стесняйтесь изучить другие подходы, такие как моделирование на основе Монте-Карло или машинное обучение. Работая с этими методами, вы сможете значительно улучшить точность ваших предсказаний.