xG (или же Expected Goals) — это относительно новая футбольная метрика, статистический показатель основанный на различных формулах, который позволяет оценить эффективность команды или игрока.
В такой игре с низкой результативностью, как в футболе, важность голов настолько же высока, насколько и фактор везения. На всех уровнях часто проходят матчи, где несмотря на победу хозяев со счетом 1:0, например, однозначно лучше в атаке выглядела проигравшая команда гостей. Если раньше это нужно было увидеть или доказывать, ссылаясь на субъективный опыт, то xG дает возможность четко определить, кто в матче выглядел эффективнее, несмотря на счет.
Измеряющий xG показатель суммирует все созданные моменты и провалы в защите у обеих команд, и на основе неких коэффициентов показывает вероятный счет исходя из них. Например, счет в игре между Челси и Бернли первого тура АПЛ был по xG модели BBC 1.55 против 0.64 (в то время как на табло 2:3). На видео ниже аналитик из Opta рассказывает подробно что такое xG и как это трактуют статистические порталы:
Когда появился xG
Упоминание первой xG -модели, пусть и очень тривиальной, приписывают бывшему тренеру сборной Норвегии Эгилу Ольсену. С 1990 года по 1998 он прошел путь от молодежки до национальной сборной Норвегии, дважды выводил подопечных на финальный этап чемпионата мира (в 94-ом и 98-ом). В своих интервью он неоднократно утверждал, что даже такой показатель, как количество ударов в створ ворот, может быть более важен, чем итоговый счет в матче. Ольсена часто называли “футбольным профессором” за любовь к цифрам и прагматичных подход к статистике.
Сперва он считал лишь количество ударов по воротам, и на их основе формировал ожидаемый уровень эффективности команды. Позже в своих моделях Ольсен начал разделять удары на три категории, в зависимости от остроты момента, но в итоге пришел к выводу, что это было не нужно. На большой дистанции все три категории неизменно уравновешивались (с небольшим отклонением). Таким образом он строил игру команды отталкиваясь не на результаты и очки, а на более объективные показатели, пусть и в виде ударов. Итак, первые модели xG получили популярность в середине 90-х.
Правда, тогда их еще так не называли. Библиография xG говорит, что само понятие Expected Goals впервые встречалось в 2004 году в НХЛ. Что же касается футбола, то первые попытки серьезно взглянуть на взаимосвязь ударов и результативности команд в футболе замечены в 2011 году.
Как измеряют xG сейчас
Единственной, удобной и подходящей всем формулы для измерения xG сейчас нет. Существует большое количество различных xG-моделей, каждая из которых может проявить свои преимущества (или недостатки) относительно других только на очень длинной дистанции. Должно пройти какое-то время, пока разные источники статистики утвердят какие-то общие правила подсчета, но уже сейчас можно ориентироваться на крупные площадки. Такие как Opta.
При помощи огромной базы из сотен тысяч примеров, имеющейся у этой компании для анализа, они выделили для каждого опасного момента свои коэффициенты (от 0 до 0,99 в зависимости от того, как часто забивают в подобных случаях на дистанции). Исходя из позиции, положения защитников, этапа игры, расположения вратаря и даже части тела с которой бьет игрок — около 10 параметров влияют на конечный итоговый xG каждого момента. Далее по ходу игры каждый момент суммируется в общий показатель, и уже по истечению всего времени матча мы можем видеть “ожидаемый счет”.
На графике каждый удар Харри Кейна в сезоне 2016/17 изобразили в виде точек. Чем больше точка — тем больший был xG у момента, если точка красная — момент закончился голом. Как и у любого другого игрока, у Кейна было большое количество хороших незабитых моментов, но число реализованных ударов с низкой вероятностью просто поражает.
Еще один пример по Деле Али. На картинке видны все моменты лучшего молодого игрока АПЛ в сезоне 2016/17. Зеленым обозначены удары, которые привели к голам, синим — удары в каркас или сейвы, красным — удары мимо.
Недостатки большинства моделей
Так как система подсчета вероятности забитых голов по xG только формируется, у текущих моментов есть несколько существенных проблем. Решения для них пока не очевидны, но ознакомиться с ними для понимания ситуации обязательно стоит:
- Если момент не закончился ударом, то по нему большинство моделей xG не учитывают. Это огромный минус, так как есть очень много случаев, когда игрок либо из-за брака техники, либо из-за внешних факторов не успевает бить по пустым воротам, например. Таким образом если бы удар был выполнен, его xG мог быть 0,98 но так как игрок не отправлял мяч в ворота, то и плюсовать модели (когда модель ориентируется по ударам) нечего.
- Если в игре получилась ситуация, когда ворота оказались незащищенными (вратарь вышел на угловой, например), игроки с большей вероятностью стараются моментами такими пользоваться, бьют чуть ли не с центра поля. Однако, основанные на аналогичных позициях xG-модели скажут, что вероятность попадания таких ударов стремится к нулю. Очевидно, это не так. Сразу виден более сильный недостаток многих моделей — мало где учитывается расположение игроков обороны.
- Из-за того, что модель не учитывает мастерство игрока атаки, многие коэффициенты для опытных форвардов не будут верными. Точно также как мы знаем, что средние показатели реализации в чемпионате Венгрии, например, ниже чем в чемпионате Испании, знаем и то, что нападающий в Ла Лиге с большей вероятностью забьет в пределах штрафной площади, чем нападающий Вышки венгерского дивизиона. Но xG-модели никак не учитывают этот момент. Для них есть одна и та же цифра, независимо от полей и исполнителей. Наверное, в этом контексте стоит подумать об индивидуальных моделях для каждого игрока, но что тогда должно быть основой первичных данных?
- Автогол или пенальти никак не учитывается, берутся только моменты “с игры”. Это одновременно и плюс, и недостаток, поскольку очень часто они становятся итогами опасных атак без ударов. А о проблеме атак без ударов мы уже знаем (смотри пункт 1).
Это не все недостатки современных xG-моделей, но для справедливости стоит признать, что из года в год они совершенствуются. Технологии все дешевле, обработанных данных все больше. Важно только принять подход, наиболее верный и наиболее эффективный для измерения силы команды.
Будущее xG в футболе
Пока что сложно предсказать, как именно и на каком уровне появление xG будет влиять на самый популярный вид спорта. Но исходя из природы его появления и применения моделей на данный момент, можно точно сказать, что:
- – все статистические порталы рано или поздно начнут учитывать xG в альтернативных турнирных таблицах чемпионатов
Если этот показатель настолько хорошо говорит об уровне игры команд, вполне логично использовать его в качестве одного из важных параметров статистики. Любая аналитика перед матчем без изучения xG сейчас — это попытка найти иголку в стоге сена человеком с плохим зрением, который отказывается надевать очки. Ведущие медиа-площадки, спрос на которые напрямую зависит от того, как часто они справедливы в своих прогнозах, это понимают. На Туманном Альбионе и в США, пусть и осторожно, но пользуются показателями xG у всех команд ведущих лиг. Но есть еще одна очевидная сфера, где модели могут пригодиться.
- – все ведущие прогнозисты с большой аудиторией скоро будут учитывать, если не учитывают xG уже сейчас
Во-первых, глупо не использовать его тем аналитикам, которые пытаются зарабатывать на ставках. Если есть показатель, способный помочь тебе заработать больше чем ты получаешь со ставок сейчас, ты ним обязательно воспользуешься. Однако, если “вольные игроки”, работающие чисто на себя, могут действовать как сами захотят, то популярные прогнозисты с продажами своих прогнозов будут вынуждены сделать это как можно скорее. Пользователи очень трепетно относятся к трате своих денег, и не будут спускать их на людей, которые не следят за современными тенденциями. Даже если прогнозист прибыльный, незнание того как работает и зачем нужен xG, клиента отпугнет. Имейте это ввиду, конкуренцию никто не отменял.
- – в отличие от западного ТВ, в странах СНГ на телевидении никакого xG можно не ждать еще очень долго
Какой там xG, если наши спортивные каналы даже время и элементарное владение мячом не всегда показывают. Все тренды до людей, работающих на ТВ у нас доходят крайне медленно. Для описания причин понадобится отдельный пост (или книга?), поэтому просто примите это как факт: пока США и Европа будет просвещать зрителей новыми статистиками и пытаться углублять знания в своих аналитических передачах, наши комментаторы еще долго будут игнорировать xG.
- – обыгрывать букмекера, основываясь на xG можно, но только нашего и недолго
Как мы уже писали выше, тот же Sky Sports занимается xG вплотную. С Opta тоже сотрудничает сразу несколько лидеров рынка беттинга, само собой что за бугром все давно его используют. Пока до наших букмекеров это доходит только под видом “исправленных” коэффициентов на основе линий Bet365 и Pinnacle, но вскоре свои команды экспертов в этой сферы появятся и здесь. А если так, то чтобы быть на пару шагов впереди — стоит учиться использовать его раньше и выигрывать на ошибках местных буков, пока это еще возможно. Серьезно, стоит пробовать, вилками тоже когда-то заработать можно было в рамках одной конторы. Реагируют быстро далеко не все.
Куда заходить и что изучать?
Для начала подружитесь с порталом understat.com — поможет понять как собирают данные для ведущих топ-5 чемпионатов. С недавних пор там также показываются цифры и по РФПЛ.
В конкретной турнирной таблице чемпионата, в котором разбираетесь лучше всего, посмотрите насколько набранные очки каждой из команд сейчас соответствуют ожиданиям по xG. Куда идет отклонение — набрали больше чем должны были, или меньше? В первом случае команда, возможно, в ближайшее время опуститься на несколько строчек, во втором — займет справедливое место выше на более длительной дистанции.
Также присмотритесь к таблице с голами и ассистами от игроков. Здесь все аналогично: у некоторых из них xG явно больше чем забитых голов, значит реализация вскоре станет лучше. Те же, кто забивают явно больше чем моменты позволяют в среднем, скорее всего в показателях должны потерять.
Далее откройте страницу команды. Для каждой из команд здесь сделали очень обширную по функционалу таблицу, которая позволяет смотреть кто чаще отдает пасы под удар, при каких игровых схемах xG был больше, на каких скоростях лучше реализация — огромный пласт для анализа.
Отсюда изучайте последние сыгранные матчи. Там тоже очень подробная аналитика, которая позволит найти верные взаимосвязи между успешностью тех или иных команд, четче увидеть недочеты в игре каждой из команд.
В заключении пройдитесь по топ-форвардам, анализируя их выступления как в отдельных матчах, так и в прошлых сезонах глобально. Это позволит вам предсказать, в какой форме к следующему отрезку чемпионата подойдет тот или иной лидер атаки, и какие последствия это окажет на результаты матчей.
Итоги
Как видите, если пару лет назад еще можно было считать анализ при подготовке к матчам делом сложным, то сейчас он со скоростью света упрощается. Появление xG — это не просто еще одна возможность подробнее изучить матч, это прямой показатель того, как технологии в спайке с Big Data и нейросетями упрощают аналитикам жизнь. Все становится доступнее, главное уследить за главным и научиться как можно более точно определять, какие факторы в анализе являются ключевыми, а какими на дистанции можно пренебречь.
Это жесть написать в статье про understat с его кривым xG и 5 чемпионатами и не написать про xscore.win с 50 чемпионатами и самым точным xG