Подать заявку Подать заявку

Прогнозирование футбольных матчей

4.6
29 оценили
Прогнозирование футбольных матчей
4 Апреля 2018
5434

Содержание:

В предыдущей статье, был анонсирован переход к моделям прогнозирующим вероятности исходов футбольного матчей при помощи xG. Это довольно длинная и обсуждаемая тема, к тому же до конца не изученная. Постараемся разобраться? Прежде чем говорить, непосредственно, о моделях прогнозирования давайте несколько абзацев посвятим базовым аспектам, чтобы понять какие у нас требования при создании таких моделей.

Фатальные ошибки при прогнозировании футбольных матчей

Многие новички, пытаются делать прогнозирование матча относительно победителя или спрогнозировать, будет ли в нём тотал больше или тотал меньше, не принимая во внимание коэффициент, который дает контора на определённое событие.  Не сопоставляя его с шансами наступления события, на которое ставят ставку.

На форумах часто встречаются такие абсурдные высказывания: «Думаю, в 60% случаев эту игру выиграет Челси, поэтому буду ставить на победу за коэффициент 1,5».

Значит, автора фразы устраивает, то что поставленная им ставка сыграет чаще, нежели не сыграет. Ему вполне нормально, что если она будет заходить лишь в 60% случаев, то при данном коэффициенте на дистанции им будет проигрываться 10% от поставленной суммы. То есть, когда он сделает 100 ставок по $10 на коэффициент 1,5, то в среднем на дистанции потеряет $100. Здесь лёгкий расчет, но думаю, стоит на нём остановиться, чтобы никто не задавался лишними вопросами.

На одну ставку проставляется $10. Выиграет она в 60% случаев, а проиграется в 40% случаев. Поэтому, с вероятностью 40% форумчанин понесёт убытки в 10$, а в 60% случаев выиграет $5, (так как ставились $10 за коэффициент 1,5). Получается, с каждой ставки на длинной дистанции, будет потеряно в среднем по $1.

Формула расчета представлена ниже:

формула расчета математических ожиданий

Как правильно прогнозировать футбольные матчи? Как рассчитать исход матча?

Чтобы не терять деньги на длинной дистанции, а наоборот, зарабатывать их, вы должны ставить только те ставки, у которых на один из исходов есть положительный ROI. Что такое РОИ посмотрите в коротком видео по ссылке. Чтобы найти ставку с положительным РОИ необходимо максимально точно предсказывать вероятности исходов матча. Иными словами, нужно максимально точно рассчитать вероятности:

  • выигрыша домашней команды;
  • выигрыша гостевой команды;
  • ничьей.

После чего, нам будет легко найти матчи с положительным ROI на исход. Просто перемножить каждую вероятность с коэффициентом на тот же исход, выставленным конторой.

Расчет вероятности исхода футбольного матча

Допустим, анонсируется футбольная встреча сборных Чехии и Панамы. И мы при помощи своих подсчётов вычислили такие вероятности:

  • Чехия выиграет – 38%;
  • Ничья - 32%;
  • Панама победит – 30%.

Контора же, в которой хотим поставить деньги, выставила на игру такие коэффициенты в линии:

  • 2,5 – на победу Чехии;
  • 3,2 – ничья;
  • 3,15 – на победу Панамы.

Если сделаем ставку на выигрыш Чехии, то она будет с ROI -5% (минус 5), что означает на длинной дистанции, потерю 5% от суммы, поставленной на эту команду.

Расчёт не хитрый:

  • 38% (вероятность триумфа чешской сборной) *2,5 (коэффициент её же выигрыша) -100 = -5%

Ставить будем на Панаму? Тогда:

  • 30% (вероятность победы панамцев) *3.15 (коэффициент выигрыша Панамы)-100= -5,5%

Если расчёты вероятностей побед точны, то нам не следует ставить на победу какой-то из команд. Верным действием будет игнорировать текущие ставки или дождаться момента изменения коэффициентов.

Теперь рассмотрим ничью:

  • 32% (вероятность ничейного результата) * 3,2 (коэффициент данного события)-100= +2,4%

Судя по подсчётам, при ставке на ничейный результат ROI будет равен 2,4%. Это как раз то, что нам нужно, ведь на дистанции прибыль будет 2,4% с каждого внесённого $1 на исход без победителя. Таким образом, подытожив, мы можем сказать, что все что нам нужно для заработка ставками - научиться:

  1. верно прогнозировать вероятности результатов игр (ничья или выигрыш одной из команд);
  2. затем мы легко сможем

  3. определить ставки с положительным ROI;

Теперь, когда пришло понимание необходимости обучения и точного определения вероятности результатов события, давайте перейдем к обучению прогнозирования вероятностей.

Топ-3 лучшие книги по теории вероятностей и статистики для прогнозирования любого события

За прогнозирование вероятностей любого события, отвечают науки - теория вероятностей и статистика.  Вот список литературы, в которых изложены основы по данным наукам:

  1. Доступно и понятно для неискушённого читателя составлены книги Е.С. Вентцель, которые предназначались для артиллеристов. Также они содержат массу подробнейших примеров.
  2. Для людей с математическим складом ума, советуем учебник Чистякова В.П. «Курс теории вероятностей», рассчитанный на студентов вузов. Лаконичная книга, в которой  вкратце изложены главные моменты.
  3. Еще одну книгу «Руководство для инженеров по решению задач теории вероятностей». Ленинград, 1962 г, рекомендуем сделать вашей настольной книгой.

Теория вероятностей – математическая наука. Поэтому для прогнозирования вероятностей наступления того или иного события разрабатываются математические модели. Задача состоит в создании максимально точной модели, ведь чем точнее рассчитаны вероятности, тем надёжнее наши ставки, соответственно, ROI будет выше.

Нет времени на чтение? И теория прогнозирования футбольных матчей кажется слишком сложной? По ссылке найдете видео лекции. Лектор мастерски доносит мысли. Для облегчения вашего обучения, мы потратили несколько дней на поиск в YouTube достойного преподавателя и анализ его видео уроков.

На нашем YouTube канале тоже рассказывается и показывается всё максимально подробно, чтоб вы наверняка поняли, как и что делать для прогнозирования исходов матчей.

Обучающий контент, пакет "Инструментарий", бесплатные прогнозы от xScore

Прогнозирование спортивных событий. Какие данные использовать?

При создании любой модели, прогнозирующей вероятности,  задумайтесь о том, на какого типа данных она будет построена?

Прогнозирование результатов матчей в баскетболе

Например, в баскетболе могут выстраиваться различные системы прогнозирования на набранных командой очках в матче. Известно, что этих очков достаточно много в каждой игре, а значит и в каждом сезоне. В НБА за сезон насчитывается много матчей, поэтому база данных для прогнозирования в каждом сезоне собирается  быстро.

Прогнозирование результатов игры в теннисе

В теннисе сложнее. Нет смысла вести расчёт вероятности по окончательному счёту, вернее, на основе количества выигранных сетов в том или ином матче. Ведь сетов играется очень мало, бывает, что спортсмены за месяц проводят всего 6-8 сетов. Даже если составить модель по данным сыгранных сетов, на их основе никак нельзя посчитать точные вероятности какого-либо тотала геймов. Мы никак не узнаем, какова вероятность, что теннисисты разыграют ровно 17 геймов или 18 геймов в матче. Но эти вероятности нужны для расчёта вероятностей тотала.

Я видел множество примеров расчетов тотала в теннисе. И все они основывались на прошлых матчах, пытаясь спрогнозировать как часто матч закончится больше или меньше тотала, указанного в линии букмекерской конторы. Это абсолютно неверный подход! Чтобы прогнозировать тотал необходимо создать модель, которая будет определять вероятности каждого количества геймов. То есть, после того как модель сделала расчеты, мы должны знать какова вероятность того, что в матче будет ровно 14 геймов, какова вероятность что будет ровно 15 геймов, 16, 17 и так далее.

Если в теннисе нет возможности прогнозировать вероятности на основе сетов, то как же это делать? Возможно задействовать результаты геймов. Но и с ними не всё так гладко. Количество сыгранных теннисистом геймов по-прежнему недостаточно.

Теннис - одиночный вид спорта, значит, большое значение на вероятности, оказывает текущая форма игрока. Поэтому модели строятся только на основе последних данных, ведь показатели за несколько месяцев уже не точны, из-за различия в состоянии формы спортсмена. Ещё одним камнем преткновения является то, что геймы набираются не всегда линейным способом. К примеру, никак нельзя сыграть ровно 11 геймов в сете, что влияет на прогнозирование тотала. Анализ показал, что точнее всего вероятности окончания теннисного матча с тем ли иным результатом прогнозируются на основе данных о вероятности выиграть один розыгрыш.

Зная вероятности выигрыша очка на своей подаче одним теннисистом против конкретного соперника, можно без труда (с помощью метода Монте-Карло) узнать абсолютно любую вероятность в матче: от вероятности побед теннисистов, до того, с какой вероятностью итоговый счёт будет 6-4, 5-7, 2-6.

На рисунке ниже расположена схема, на основе которой строится модель Монте-Карло в Excel. Советуем выполнить подобное построение, занятная практика.

схема модели Монте-Карло

Прогнозирование исхода футбольных матчей

Вернёмся к анализу футбольных ставок. Какие показатели использовать при построении модели? Кто-то предположит, что это результаты прошедших матчей, а именно голы. Предлагаем взглянуть на игру с математическим стороны, чтобы доказать несерьезность этого мероприятия. Футбол считается самым дисперсионным видом спорта, и мы в состоянии это подтвердить.

Из всех спортивных состязаний, на которые конторы принимают ставки, лишь в этой игре возможен вариант, когда владеющая инициативой команда бьёт по воротам в несколько раз больше другой, но терпит поражение. Любой болельщик наблюдал матч, в котором в ворота одной команды наносится шквал ударов, но она выигрывает, произведя в ответ всего-то пару «выстрелов».

Всё потому, что футбол отличается от остальных видов спорта низкими показателями результативности. А добрая половина попыток «взять ворота» имеет шанс на успех менее чем в 5% случаях. И лишь небольшое количество «выстрелов» превышают 30%.

Сложно представить, чтобы в гандбольном поединке одна команда смогла бросить в сторону ворот соперника 30 раз, а вторая – 3 раза, и при этом победу бы праздновала вторая команда. Понятно, что вторая команды вообще не имеет шансов победить, ведь вероятность поражения цели в каждом броске этой командной игры на порядок выше, чем в спорте №1. В связи с этим команда, сделавшая 30 бросков, забьет даже при худших раскладах не менее 10 голов, при лучших раскладах может забросить и 25 раз из 30 бросков. Выходит, что команда с 3 бросками вообще не претендует на выигрыш. В баскетболе так же наблюдается подобная картина: команда, в итоге совершившая в 10 раз больше попыток забить мяч в кольцо, чем соперник, победит в любом случае.

Наиболее близкий к футболу – хоккей, но там дисперсия поменьше, так как за игру наносится больше ударов и шайбы забиваются чаще. Также в хоккее проводится больше игр. Однако хоккейная дисперсия также очень большая, что не даёт возможности строить модели, опираясь на результат матча.

Прогнозирование матчей с использованием традиционной статистики: удары, владение

Снова встаёт вопрос о том, как всё-таки рассчитывать вероятности исходов футбольного матча? Есть вариант построения модели прогнозирования, основываясь на более мелких элементах игры, чем голы, а именно, на ударах по воротам и владении мячом. Вкратце поведаем, как работали системы несколько лет назад и как делались ставки людьми, которые не смотрели ни одного матча за год.

Когда я проживал в Чехии, то познакомился с одним успешным беттором из Германии. Его звали Пауль. Мне довелось видеть, как он делает ставки на футбол и какие системы при этом использует. Для получения информации о вероятности того или иного исхода матча он сначала высчитывал вероятности по владению мячом и ударам. Допустим, в матче Лион и Марсель им были рассчитаны такие вероятности владения мячом:

вероятности владения мячом в матче Лион и Марсель

На картинке видно, что у каждого владения есть своя вероятность. Например, в 10% матчей Лион будет контролировать мяч ровно 55% времени; в 8% матчей Лион с мячом будет ровно 54%; а в 2 % матчей Лион - 48% времени. Представленные вероятности зависят от различных вариантов хода матча.

То же самое Пауль делал и по ударам в ворота. Ниже на картинке наблюдаем, что в 8% случаев Лион произведёт ровно на 4 удара больше соперника. И так же в 8% встреч – ровно на 3 удара больше, чем соперник. 1% матчей от команды будет иметь в итоге на 16 ударов больше соперника, и так же в 1% – на 10 ударов, наоборот, меньше чем соперник.

вероятности ударов в матче Лион и Марсель

Таким образом, он работал и с пасами, угловыми, другими статистическими данными. Какие же были дальнейшие действия?

У него были математические модели, основанные на статистике с 30 000 матчей, эти модели помогали ему конвертировать вероятности владения, вероятности ударов и вероятности прочих статистических данных в вероятности исходов события. К сожалению, у меня нет данных Пауля, так как в то время я не делал ставки, а когда я обратил внимание на ставки, то сразу начали работать с xG. Поэтому буду показывать примеры с данными собранными за 3000 матчей специально для этой статьи. Если кто-нибудь желает пользоваться этой стратегией, которую я сейчас покажу, то скажу сразу, нужно в идеале собрать статистику как минимум с 30 000 матчей, чтобы получить точные данные.

Обратим внимание на четыре колонки в таблице ниже.

  1. Первая содержит разницу ударов по воротам от домашней команды и от команды гостей. Уточню, что для примера указаны лишь несколько показателей разниц, в реальности команды могут нанести не только на 5 ударов больше, но и на гораздо большее количество. Сейчас нам это не принципиально.
  2. Вторая колонка - вероятность выигрыша первой команды при определённой разнице в ударах.
  3. Третья, соответственно, указывает на вероятность ничейного результата.
  4. В четвёртой же размещены вероятности побед второй команды.

таблица вероятностей для разницы ударов

Допустим, первая команда по воротам нанесёт на 3 удара больше, тогда она одержит победу в матче в 47% случаев, сыграет вничью с вероятностью 26% и проиграет в 27% матчей. Если при игре дома команда нанесёт на 5 ударов меньше, то она выиграет в 32% случаях, в 28% игра закончится ничьей, а проигрыш «в домашних стенах», соответственно, произойдёт в 40% матчей. На основе показателей прослеживается отличная корреляция между нанесёнными ударами по воротам и вероятностями исхода матча.

Теперь становится понятна логика Пауля в матче Лиона и Марселя. Он вычислял, с какой вероятностью Лион в 8% матчей нанесёт на 3 удара больше по воротам:  можно понять, что в матчах, в которых разница будет ровно 3 удара, Лион одержит победу в 47% случаев, ничья же будет в 26%, а победа соперника - в 27%.

вероятности ударов в матче Лион и Марсель

Значит, из этих 8% игр Лион будет праздновать победу при 8*0,47=3,76%, ничья возможна в случае 8*0,26=2,08%, а Марсель выиграет с вероятностью 8*0,27=2,16%.

формула расчета исхода матча

После этого подобный анализ проводился и для других вероятностей, к примеру, когда в 2% матчей Марсель сделает на 5 ударов больше по воротам, он выиграет в 40% случаев, вничью закончит встречу в 28% и проиграет в 32%. То есть в этих 2% имеем 2*0,32=0,64% победы Лиона, 2*0,28=0,56% ничьей, 0,8% выигрыша Марселя и так далее.

В 5% матчей.png

Если умножать все вероятности из этой кривой Гаусса

диаграмма3.png

на показатели из таблицы вероятностей,

таблица вероятностей для разницы ударов

Пауль мог получать вероятности исходов матча Лиона с Марселем. Такие действия проделывались по ударам, по владению, и по нескольким другим статистическим данным. Это могли быть пасы, отборы, угловые. После всех этих манипуляций он знал довольно точные вероятности исходов событий и на дистанции опережал пул игроков с приличным ROI. Для этого ему нужно было лишь выстроить модель, которая прогнозирует вероятности пасов, владения, ударов и так далее.

Такая модель строится достаточно несложно. Рассмотрим ее, когда будем обсуждать, каким образом строить подобные модели для xG.

При внимательном изучении таблицы можно заметить, что при равном показателе ударов (0), например, 15 на 15, вероятность победы первой команды равна 39%, а второй – всего лишь 31%.

Это объясняется ни тем, что домашние команды лучше реализуют моменты при своих зрителях (на реализацию самого удара не сильно влияют домашние или гостевые трибуны), а тем, что домашние команды в игре создают более опасные моменты, чем гостевые. Например, команды, играющие на родном стадионе, реже наносят удары издали, и чаще – с близкого расстояния. Значит, вероятность забить гол у домашней команды чуть выше, чем у гостевой. И поэтому, 15 ударов домашней команды лучше, чем то же количество у гостевой команды. Может быть в общем незаметно, но спустя время, мы изучили статистику по xG и, действительно, обнаружили математическое подтверждение этому факту. В дальнейшем у нас выйдет множество видео по xG де расскажем об этом подробнее.

Прогнозирование результатов футбольных матчей на основе другой футбольной статистики

Системы, имеющие в основе процент угловых, владения, и количества ударов, могут довольно точно определять вероятности исходов предстоящих игр. Но используя xG, мы можем узнать не только количество ударов в матче, а и вероятность, при которой каждый удар станет голом. Это ведёт к прогнозированию вероятностей с поразительной точностью.

В следующей статье вы узнаете, как можно прогнозировать вероятности именно с помощью системы xG!

Подписываться на нас в соц. сетях (TelegramYouTubeVKFacebook), чтобы первыми узнавать о выходе новых уникальных учебных материалов и об обновлении статистики.

Обучающий контент, пакет "Инструментарий", бесплатные прогнозы от xScore