Рейтинг@Mail.ru
Мнение
24 марта 2020

ПРЕМЬЕР-ЛИГА
Десять заповедей футбольной аналитики

Том Уорвиль / The Athletic
Этот гайд поможет вам лучше понять контекст, необходимый при рассуждениях о командах и игроках, а также обратит внимание, на каких цифрах нужно сосредоточиться и как лучше анализировать то, что вы видите
В прошлом году обозреватель The Athletic Бен Болдуин написал статью, в которой подробно описал десять заповедей основанного на статистике анализа другого футбола. Того, что с мячом смешной формы. Наша игра также поддается исследованиям с использованием больших данных. Но стоит подчеркнуть: тот факт, что такие данные существуют, еще не значит, что они всегда используются правильно.

Итак, десять заповедей.

Не стоит использовать процент сэйвов для оценки голкипера с точки зрения отражения ударов

Пример: Мартин Дубравка занимает восьмое место по отражению ударов в АПЛ в этом сезоне с процентом сэйвов 73,9 процента.

Почему это вводит в заблуждение: уравнение для процента сэйвов – это число спасений, делимое на общее количество ударов. Нет никакого учета разницы в типе и качестве ударов, с которыми сталкивается вратарь, а это имеет большое влияние на его способность совершать спасения, а следовательно – и на его процент сэйвов.

Вратарь X, которому приходится столкнуться с 10 ударами из пределов штрафной, будет иметь более ограниченное время на реагирование по сравнению с вратарем Y, которому угрожали те же 10 раз, но с 25 метров и дальше.

Показатель ожидаемых голов xG и его двоюродный брат – показатель ожидаемых голов с учетом ударов в створе xGoT – говорят нам, что выстрелы с дальнего расстояния сложнее преобразовать в голы, и если они идут в голкипера или просто по центру ворот, скорее всего, вратарь возьмет мяч. Любой читатель, насмотревшийся футбола, скажем то же самое, что и эта продвинутая статистика.

Равным образом оценивая каждый удар, чтобы рассчитать процент сэйвов, мы оказываем медвежью услугу вратарю X и заставляем вратаря Y выглядеть лучше, чем есть на самом деле.

Что использовать вместо этого: сравнение качества ударов по воротам с использованием параметра ожидаемых голов в створ (или ожидаемых голов после ударов) с количеством пропущенных мячей. Это бы добавило столь необходимый контекст к статистике голкиперов.

Так, показатель предотвращенных голов учитывает качество ударов, с которыми столкнулся конкретный голкипер, по сравнению со среднестатистическим вратарем.
Благодаря этому Мартин Дубравка выглядит гораздо лучше, чем говорит его процент сэйвов, а Висенте Гуаита – голкипер мирового класса
Не стоит использовать показатели дистанции или спринтов для оценки стараний игрока

Пример: Месут Озил сегодня пробежал больше, чем любой другой игрок «Арсенала» – 11,2 километра.

Почему это вводит в заблуждение: клубы АПЛ имеют доступ к трекинг-данным с сезона 2013/14 годов, и частью этой сделки является доступ средств массовой информации к этой статистике. До этого момента всё, что мы действительно видели, – это статистика пройденных расстояний и скорости спринтов.

Реальность такова, что эти цифры являются одними из самых пустых вне контекста, но они часто используются при анализе команд и игроков. Причин для отказа от использования такой статистики много.

Во-первых, нет никакой корреляции между расстоянием, которое вы пробегаете, и вероятностью выиграть матч. Знать расстояние, пройденное за определенное количество времени, полезно в видах спорта на выносливость, а в футболе – нет. Судя по прошлогоднему техническому отчету УЕФА о Лиге Чемпионов, донецкий «Шахтер» в среднем бегал больше всех 32 команд-участниц турнира, но всё же занял третье место в своей группе и выбыл из Лиги Европы в 1/16 финала. «Манчестер Юнайтед» шел вторым с конца по этому показателю, но всё же смог выйти в четвертьфинал. Расстояние нам почти ничего не говорит.

Во-вторых, пройденная дистанция и спринты зависят от стиля, т. е. показатели, которые игроки демонстрируют, будут связаны с тем, что от них требуется, системой, в которой они играют, с тем, как действует соперник, физическим состоянием и различными другими факторами. Вне упоминания других факторов и параметров эти цифры не дают нам большого понимания.

Наконец, есть также некоторые доказательства того, что бегать меньше на самом деле может быть полезно – просто спросите Лионеля Месси. Большинство игроков имеют достаточный уровень физической подготовки, чтобы продержаться на ногах всю игру, но манипуляция пространством – это то, что действительно имеет значение. Этот вид спорта знает множество шустрых футболистов, но самые лучшие из них обладают знанием, когда использовать свой темп. Игрокам крайне редко представляется возможность устраивать гонки на поле, поэтому важное умение – всплеск скорости в нужный момент, чтобы обойти кого-то в борьбе за мяч.

Есть определенная ценность в этих данных, но связана она с атлет-менеджментом и пониманием, что игроки находятся в нужном состоянии, чтобы играть. Футбол – это игра пространства и времени, и нынешние инструменты для их измерения слишком грубы, чтобы заинтересовать.

Что использовать вместо этого: действительно нет хорошей альтернативы. Либо эти цифры должны быть правильно сформулированы, оформлены контекстно, либо нам, вероятно, лучше обойтись без них.

Не стоит использовать статистику владения как показатель качества игры

Пример: у «Тоттенхэма» было 79,8 процента владения мячом в матче, проигранном «Ньюкаслу» со счетом 0:1; второй по величине показатель для проигравшей команды в АПЛ с сезона 2003/04.

Почему это вводит в заблуждение: как подчеркивается в книге Марти Перарнау Pep Confidential, «владение – это только средство для достижения цели, это инструмент, а не цель прямо сейчас или конечная цель». «Лестер Сити» выиграл лигу, владея мячом в среднем 42,6 процента времени. «Манчестер Сити» выиграл чемпионат тремя сезонами позднее, набрав в среднем 67,7 процента владения. В сущности, не важно, как часто мяч у вас – важно то, что вы с ним делаете.

Победа в битве за владение мячом на самом деле не говорит нам ничего, кроме того, как команды стилистически настроены на игру, к тому же эта статистика может быть полностью продиктована счетом. Возьмем недавнюю победу мадридского «Атлетико» со счетом 1: 0 над «Ливерпулем» в Лиге Чемпионов. «Атлетико» установил окончательный счет (голом на четвертой минуте), имея всего 27 процентов владения мячом. Этот анализ, возможно, выглядел совершенно иначе, если бы не ранний гол.

Что использовать вместо этого: статистика владения – это всё еще полезный кладезь информации, позволяющий понять, какая команда чаще встречалась с мячом, но не используйте его, чтобы явить какие-либо аргументы, что один соперник был лучше другого. Ожидаемые голы – это гораздо лучший показатель качества выступления, поэтому, если вы хотите спорить о качестве, посмотрите, насколько хорошо ваша команда создает и предотвращает опасные моменты.

Не стоит судить о качестве выступления игроков обороны по числу отборов и перехватов

Пример: Рикардо Перейра – лучший защитник Премьер-Лиги, на его счету 119 отборов мяча.

Почему это вводит в заблуждение: не вся оборонительная работа, которую выполняет игрок, осязаема, и показатели, которые можно подсчитать, часто связаны с игровым стилем. Логично, что если команда меньше владеет мячом, то она больше времени будет проводить в обороне, накапливая статистику, и наоборот.

По этой причине показатели отборов и перехватов являются лучшими индикаторами оборонительного стиля (т. е. они говорят, является игрок пассивным или активным в защите) и не обязательно призваны оценивать навыки футболиста. Вирджил ван Дейк совершает всего 0,76 попытки отбора за 90 минут, но никто не будет утверждать, что это делает его плохим защитником.

Кроме того, поскольку эти оборонительные показатели находятся во власти стиля команды, за которую выступает игрок, трудно сравнивать одного футболиста с другим.

Что использовать вместо этого: мы можем настроить оборонительную статистику, исходя из количества раз, когда игроки выполняют защитные действия на каждую тысячу касаний, которые делает противник, когда он находится на поле – тем самым мы уравниваем метод оценки. Джордан Хендерсон с 2,6 отборами в среднем за матч занимает 15-е место в лиге, но при корректировке с учетом 1000 касаний мяча соперником его показатель почти удваивается, и капитан «Ливерпуля» становится пятым по активности в обороне полузащитником АПЛ.

Скорректированные с учетом владения оборонительные цифры дают более четкий взгляд на активность в защите, но они по-прежнему связаны со стилем команды, а не с качеством отдельно взятого футболиста.

Не стоит использовать показатель успешности отборов для оценки качества игры футболиста в отборе

Почему это вводит в заблуждение: открою вам секрет: успешные отборы и неудачные отборы – это практически одно и то же, если вы игнорируете еще два фактора при оценке такой игры.

Отборы мяча обычно делятся на две категории – успешные и неудачные. Удачный отбор означает, что футболист отвоевывает владение мячом в борьбе за него, в то время как неудачный отбор говорит нам, что попытка отвоевать мяч была, но закончилась ничем. Второй вариант может быть вызван рядом условий, например, тем, что мяч после борьбы за него улетел в аут.

Сейчас успешность отборов вычисляется исходя из того, сколько из общего числа попыток оказались удачными – то есть, это доля отборов, после которых удалось вернуть владение себе.

Так в чем же проблема? Статистика игнорирует случаи, когда игрок пытается совершить отбор, и мяч отскакивает от футболиста, владевшего им, или совершается фол. Фулбеком АПЛ с самым высоким коэффициентом успешных отборов является Мартин Келли – 80 процентов. А когда мы смотрим футбол, то видим, насколько хорошо со стороны в этом компоненте выглядит Аарон Уан-Биссака, хотя по статистике он даже не входит в топ-10 среди крайних защитников. О чем нам это говорит?

Что использовать вместо этого: включить в уравнение два отсутствующих условия и учитывать потери команд при попытках отбора мяча, а также фолы. Тогда Уан-Биссака с процентом 78,9 станет лидером, а Мартин Келли логично опустится на 29-е место.
Не стоит использовать параметр «голы минус xG» как показатель качества завершения атак на небольшой дистанции

Пример: Роберто Фирмино забил всего восемь мячей при 12,7 xG, поэтому он плохой финишер.

Почему это вводит в заблуждение: когда дело доходит до оценки качества завершения атак игроками, стоит учитывать два важных элемента, которые необходимо рассматривать и исследовать изолированно. Первый – это способность нападающего создавать для себя моменты. Голы – это основная валюта, которой оперирует нападающий, и чтобы забивать мячи, форварды должны совершать удары по воротам. Чтобы измерить качество этих ударов, мы используем xG. Если игрок постоянно выходит на хорошие позиции для удара, со временем голы приходят.

Но одно дело – бить по воротам, и совсем другое – забивать. В небольших выборках, например, в течение всего сезона – статистика голов и xG у футболиста может не совпадать. Возьмем хотя бы Роберто Фирмино. В этом сезоне он забил меньше, чем можно было бы ожидать, учитывая его шансы, но это его лучший результат с точки зрения выгодных голевых позиций.
Фирмино в предыдущие два сезона забивал как больше ожидаемого, так и меньше. Этих данных недостаточно, чтобы сделать выводы о том, насколько он хорош в завершающей стадии
Что использовать вместо этого: сравнивать xG с ожидаемыми голами после ударов в створ – это один из простых методов оценки качества финишера. Тем не менее, эти параметры всё равно нужно применять осторожно, рассматривая несколько сотен ударов.

Однако в кругах футбольных аналитиков существует много споров о том, является ли завершение атак воспроизводимым, повторяемым навыком – насколько вообще он может полностью зависеть от бьющего? И пока на сей вопрос нет правильного ответа, полагайтесь на статистику ожидаемых голов в надежде, что рано или поздно все футболисты начнут забивать в соответствии со своим xG.

Не стоит судить о выступлении команды, опираясь на наличие/отсутствие игрока

Пример: Процент побед «Арсенала» в этом сезоне без Месута Озила выше (40 процентов), чем с ним в составе (28 процентов).

Почему это вводит в заблуждение: статистика в духе «с ним или без него» (WOWY) предназначена для того, чтобы изолировать влияние одного футболиста на команду, чтобы увидеть, как меняются результаты, когда игрок на поле и вне него.

Эта статистика может работать, например в баскетболе, где чаще меняются составы и выше сама по себе результативность, которую легче оценивать в таком контексте. Однако в футболе существует слишком много вводных, чтобы этот параметр можно было использовать для оценки игрока. Если мы говорим об Озиле, то в его ситуации слишком многое находится вне его контроля, в том числе когда он на поле.

Вот только часть того, что в идеале стоит принимать во внимание: насколько качественно действовала оборона соперника? Отличался ли состав футболистов, игравших вместе с Озилом, а также без него? Была ли в матче красная карточка? Меняли ли Озила по ходу встречи?

Аналогичная проблема у «Бёрнли». Бен Ми и Джеймс Тарковски сыграли каждую минуту в этом сезоне АПЛ. А если бы не сыграли, было бы лучше? Мы никогда этого не узнаем.

Что использовать вместо этого: лучше анализировать игру футболистов в контексте их позиции и сосредоточиться только на том, что они могут контролировать. Для Озила и других креативных полузащитников такими параметрами будут ключевые передачи, для нападающих – голы. Оставьте WOWY-статистику для спорта, где большие парни что-то кидают в помещении.
Не стоит судить о качестве передач игрока только по их точности

Пример: Фил Бардсли – худший пасующий защитник АПЛ с точностью передач 63,6 процента.

Почему это вводит в заблуждение: точность или неточность передачи во многом зависит от того, что просят сделать футболиста, и от того, какой выбор он делает, когда оказывается с мячом. Некоторые команды, такие как «Манчестер Сити», играют в «короткий» мяч на определенных участках поля, находясь под небольшим давлением. Из-за этого у них будет высокая точность передач. Другие, такие как «Бёрнли», стремятся использовать «каналы» между игроками соперника, а также более длинные пасы вместо коротких комбинаций, что негативно влияет на точность.

Передачи могут быть, если судить по данным, неточными, но только эта характеристика не позволяет увидеть всей картины. Рассмотрим ниже пример из недавней игры «Лидс Юнайтед»:
Здесь пас Элдера Кошты в штрафную обостряет игру, но он неточный, однако это в значительной степени связано с отличной работой защитника «Халл Сити». Стоит отметить развитие атаки, сохранение владения, которые Кошта обеспечил, хотя его пас был перехвачен, мяч ушел на угловой. Нередко происходит подобное – владение сохраняется, но пас оценивается как неточный, в итоге футболисту идет статистический минус в актив.

Что использовать вместо этого: возможно, что-то можно будет предложить в перспективе, но сейчас вряд ли найдется способ, который бы за счет каких-то показателей может улучшить ситуацию. Близким к объективному можно было бы назвать параметр ожидаемых точных передач, который способен дать представление о том, почему тот или иной игрок пасует с той или иной точностью, но в свободном доступе такие метрики найти крайне сложно.

Не стоит судить о футболистах по их неудачам

Пример: Трент Александр-Арнольд сделал больше неудачных пасов, чем любой другой защитник в АПЛ.

Почему это вводит в заблуждение: Майкл Кокс подробно писал еще в январе о том, что означает «провал» в Премьер-Лиге, поэтому не будем здесь слишком углубляться. Обладатель «Золотой бутсы» меняется практически каждый сезон, потому что редкий форвард способен поддерживать голевую статистику из года в год на высоком уровне. Но если мы хотим найти лучшего финишера, то будем смотреть на процент реализации и, каким бы они ни был, нам нужны голы.

Что использовать вместо этого: в большинстве случаев, если уж обращать внимание на то, сколько раз игрок потерпел неудачу, стоит превращать всё это в процент, чтобы добавить больше контекста. Это поможет найти ответ на важный в подобных случаях вопрос: действительно ли футболист ошибается часто, или, может, он просто пробует что-то новое на поле больше остальных?

Не стоит сравнивать футболистов с разным объемом игрового времени

Пример: Трент Александр-Арнольд и Джеймс Мэддисон разделяют второе место в лиге как лучшие созидатели – по 75 биг-шансов на каждого.

Почему это вводит в заблуждение: футболисты, играющие больше, имеют больше возможностей повысить свои статистические показатели. Очевидно, что сравнивать игроков, не учитывая число сыгранных минут, сложно – выходящие на поле реже всегда будут выглядеть хуже.
Например, Эмилиано Буэндия, если учитывать сыгранные минуты, занимает второе место в АПЛ по числу созданных голевых моментов в среднем за матч – 3,3. По общему числу он вне топ-3
Что использовать вместо этого: корректируя статистику с учетом 90 сыгранных минут (деля показатели на временной отрезок матча), мы можем сравнивать футболистов, сыгравших разное количество минут. Так выводы будут более справедливыми.
Вы можете поддержать наш проект. Все средства направляются авторам материалов
Читайте также
Баргав Йоглкар / El Arte Del Futbol
23 марта
Бросать судей в пожарища в виде послематчевых брифингов – идея, которую сами рефери воспримут неоднозначно. Может, есть альтернативы?
Джеймс МакНиколас, Том Уорвиль / The Athletic
20 марта
Возможно, кричать «пас!» или «подумай о xG!» просто это не так весело, как «бей!»
Том Боделл / Football Whispers
18 марта
Когда летом 2018 года «Вулверхэмптон» договорился о трансфере Рауля Хименеса за 38 миллионов долларов, футбольный мир поморщился. Как показало время – зря