Как определить вероятность нулевой ничьей в футболе
Модель Пуассона «грешит» недостаточной эффективностью прогнозирования вероятности нулевых ничьих. В этом материале объясняется, как корректировать модель Пуассона с учетом вероятности нулевой ничьей.
Главной моделью, используемой для прогнозирования результатов футбольных матчей, является модель Пуассона. Самый простой подход заключается в том, чтобы определить параметр ожидаемого количества голов для каждой команды и соответствующим образом спрогнозировать итоговый счет.
Согласно модели Пуассона, параметр команды хозяев представляет собой средний в лиге показатель забитых голов команды хозяев, умноженный на коэффициент атаки команды хозяев и коэффициент обороны команды гостей. Первый коэффициент корректирует преимущество команды хозяев по количеству забитых голов в соответствии с рейтингами обороны команды гостей (чем сильнее оборона, тем ниже вероятность голов), а второй коэффициент – в соответствии со способностью команды хозяев забивать мячи.
Ожидаемый показатель забитых голов для команды гостей оценивается аналогичным образом, но при этом используются коэффициенты забитых голов команды гостей и коэффициенты обороны команды хозяев.
Ограничения модели Пуассона
Как и для любой другой модели, прогнозирование результатов футбольных матчей с использованием модели Пуассона связано с некоторыми ограничениями, а именно с тем фактом, что результаты зависят от изменений используемых параметров.
Кроме того, модель Пуассона предполагает, что после определения параметров ожидаемого количества голов число голов, забитых каждой командой, является независимым. Хотя это можно в какой-то степени контролировать с помощью определенных рейтингов обороны и атаки, можно ли ожидать, что вероятность того, что команда гостей забьет пять голов, будет оставаться неизменной независимо от того, сколько голов забьет команда хозяев (например, пять или ноль)?
Самым существенным ограничением модели является то допущение, что дисперсия забитых командой голов равна ожидаемому количеству голов. Это допущение представляет собой одну из характеристик распределения Пуассона. Существуют продуманные решения этой проблемы, такие как модели Пуассона с избыточной (или недостаточной) дисперсией или двумя переменными, но рассмотрение этих моделей выходит за рамки нашего материала.
Одним из суммарных эффектов этих ограничений является недостаточная эффективность прогнозирования вероятности ничьей со счетом 0:0, которая может быть выше или ниже вероятности результата матча, спрогнозированного на основании модели Пуассона. Как мне кажется, модель Пуассона демонстрирует тенденцию к занижению вероятности ничьей со счетом 0:0 для команд с высокими параметрами ожидаемого количества забитых мячей.
Реальная вероятность ничьей со счетом 0:0 для высокорезультативных команд гораздо выше, поскольку такие команды могут снижать темп, если счет остается нулевым по прошествии длительного периода времени. И наоборот, низкорезультативные команды могут поддерживать высокий темп до первого гола.
Стандартная модель Пуассона не отражает эти факты и, следовательно, завышает вероятность ничьей со счетом 0:0. В то же время вышесказанное является лишь догадкой, не основанной на каком бы то ни было эксперименте.
Как снизить или повысить вероятность ничьей
В рамках одного из подходов к корректировке вероятности ничьей со счетом 0:0 осуществляются повышение или снижение вероятности такой ничьей и соответствующая корректировка других прогнозов. Это можно представить в виде пятиэтапного процесса, который объясняется ниже на простом примере.
Этап 1. Вычисление параметров ожидаемого количества голов для каждой команды.
Скорее всего, такое вычисление (если вы не автоматизируете его) займет у вас больше времени, чем остальные этапы процесса. Для краткости мы допустим, что параметры среднего окончательного количества голов равны 1,7 и 1,2 для команды хозяев и команды гостей соответственно (это случайные значения).
Этап 2. Вычисление вероятности забивания определенного количества голов каждой командой.
Для этого можно использовать соответствующую формулу. В этом случае мы используем распределение вероятности забивания определенного количества голов по следующей формуле:
– | – | Вероятность забивания определенного количества голов | ||||
Команда | Параметр ожидаемого количества голов | 0 | 1 | 2 | 3 | 4 |
Хозяева | 1,7 | 18.30% | 31.10% | 26.40% | 15.00% | 6,40 % |
Гости | 1,2 | 30.10% | 36.10% | 21.70% | 8.70% | 2.60% |
Этап 3. Вычисление распределения вероятности различных результатов матча.
Далее следует перемножить вероятности различных результатов матча. Например, результат 0:0 имеет вероятность 18,3 % × 30,1 % = 5,5 %. Результаты представлены ниже. Обратите внимание на тот факт, что суммарная вероятность этих результатов не равна 100 %, поскольку существует вероятность и других результатов (например, 5:1). Можно добавить, что вероятность других результатов составляет 3,7 %.
– | – | Количество голов, забитых командой хозяев | – | – | – | |
– | – | 0 | 1 | 2 | 3 | 4 |
Количество голов, забитых командой гостей | 0 | 5.50% | 9.40% | 8.00% | 4.50% | 1.90% |
– | 1 | 6.60% | 11.20% | 9.50% | 5.40% | 2.30% |
– | 2 | 4.00% | 6.70% | 5.70% | 3.20% | 1.40% |
– | 3 | 1.60% | 2.70% | 2.30% | 1.30% | 0.60% |
– | 4 | 0.50% | 0.80% | 0.70% | 0.40% | 0.20% |
Этап 4. Вычисление параметра повышения или снижения вероятности ничьей со счетом 0:0.
Это вычисление может стать несколько субъективным. Например, допустим, что статистика предыдущих матчей, судя по всему, дает основания предполагать, что счет 0:0 будет получен с вероятностью 10 %. Исходя из этого, вероятность 5,5 % необходимо повысить до 10 %.
Параметр повышения вероятности можно вычислить следующим образом:
(предполагаемая вероятность счета 0:0) / (прогнозируемая вероятность) = (предполагаемая вероятность) / (вероятность (0,0)).
Если мы представим это с использованием символа α, мы получим следующее:
α=10/5.5=1.82.
По сути это означает, что мы повышаем вероятность нулевой ничьей на 82 %. Поскольку вероятность такой ничьей увеличилась с 5,5 % до 10 %, суммарная вероятность других результатов должна снизиться на ту же величину, вследствие чего сумма вероятностей всех исходов составит 100 %.
Этап 4. Вычисление параметра повышения или снижения вероятности других результатов.
Если мы используем в качестве этого коэффициента символ β, мы сможем применить следующую формулу:
β = (1 − α [вероятность (0,0)]) / (1 − [вероятность (0,0)]) = (1 − предполагаемая вероятность) / (1 − прогнозируемая вероятность).
В этом случае мы получим β = (1 − 0,1) / (1 − 0,055) = 0,95.
Этап 5. Повторное заполнение таблицы результатов матча с повышенной вероятностью.
Наконец, мы можем заново вычислить вероятности различных результатов посредством умножения вероятности счета 0:0 на α и остальных вероятностей на β. Мы получим следующие результаты, причем вероятность других результатов составит 3,5 %.
– | – | Количество голов, забитых командой хозяев | – | – | – | |
– | – | 0 | 1 | 2 | 3 | 4 |
Количество голов, забитых командой гостей | 0 | 10.00% | 8.90% | 7.60% | 4.30% | 1.80% |
– | 1 | 6.30% | 10.70% | 9.10% | 5.10% | 2.20% |
– | 2 | 3.80% | 6,40 % | 5.50% | 3,10 % | 1.30% |
– | 3 | 1.50% | 2.60% | 2.20% | 1.20% | 0.50% |
– | 4 | 0.50% | 0.80% | 0.70% | 0.40% | 0.20% |
Корректировка модели Пуассона
Итак, мы рассмотрели корректировку традиционной модели Пуассона, которая позволяет изменять вероятность нулевой ничьей. Эту модель можно расширять для корректировки любого результата при условии, что вероятности всех результатов тоже корректируются так, чтобы их сумма составила 100 %.
Но это далеко не единственный подход к изменению вероятности некоторых исходов. К примеру, на конференции MathSport, которая состоялась в июне прошлого года, доктор Алан Оуэн представил, возможно, более эффективный подход, в рамках которого используется усеченная модель Пуассона.
Такая корректировка не приводит к минимизации ограничений моделей Пуассона, определенные виды которых были рассмотрены выше. В действительности усеченная модель Пуассона вносит другие допущения – предполагаемую вероятность нулевой ничьей и корректировку всех остальных вероятностей с использованием того же коэффициента β.
Несмотря на это, применение усеченной модели Пуассона может стать шагом вперед по сравнению с использованием традиционных моделей, которые демонстрируют тенденцию к занижению или завышению вероятности нулевой ничьей.
Аналитические материалы предоставлены БКPinnacle.