Продвинутая статистика НХЛ

Всем хорошо известна фраза: 
 
"Существуют три вида лжи: ложь, наглая ложь и статистика" . 

Известность данное высказывание получило благодаря Марку Твену, но истинный автор данной фразы достоверно неизвестен.

Итак, речь пойдет о статистике и возможностях ее использования для благого дела - заработка денежных знаков у букмекера.
 

НЕМНОГО ИСТОРИИ

Статистику как средство оценки эффективности работы команды тренеры НХЛ используют давно. Родоначальником аналитики в НХЛ можно считать Роджера Пола Нильсона, который еще в конце 60-х будучи тренером начал использовать различные статистические метрики.
 

Остальные исторические аспекты можно опустить и сразу перейти к сезону 2014/2015. 
Именно к этому сезону был обновлен сайт НХЛ и вместе с его запуском обновился и статистический модуль сайта, в который впервые вошли показатели продвинутой статистики.
Таким образом, начиная с сезона 2014/2015 продвинутая статистика публикуется лигой в открытом доступе.

CORSI, FENWICK, PDO

 

Наиболее популярными показателями продвинутой статистики являются:
  • CORSI
  • FENWICK
  • PDO
CORSI = количество бросков в створ ворот + количество бросков мимо ворот + заблокированные броски

FENWICK = количество бросков в створ ворот + количество бросков мимо ворот

PDO = процент реализации бросков + процент отраженных бросков


То есть Фенвик по сути тот же Корси без заблокированных бросков.

CORSI существует двух видов:
CF (Corsi For)  - атакующие действия команды: броски, броски в створ, заблокированные соперником броски;
CA (Corsi Against) - атакующие действия соперника: броски соперника; броски в створ, нанесенные соперником; заблокированные броски соперника.

То есть упрощенно, CF - оценивает атаку, CA - оценивает оборону.

Я буду оперировать показателем CF%

CF% = 100* CF / (CF + CA)

То есть CF% показывает стиль игры команды. Если он равен больше 50%, то это означает, что команда исповедует атакующий стиль игры.

Ниже приведу срез CF% на текущий момент, 13 ноября 2016 года.
TEAM CF%
Los Angeles 54.6
St. Louis 54.4
Carolina 54.0
Boston 53.5
Florida 53.0
Philadelphia 52.6
San Jose 52.2
Washington 52.1
Calgary 51.1
Tampa Bay 50.7
Toronto 50.5
Winnipeg 50.4
Chicago 49.8
Pittsburgh 49.8
Colorado 49.8
Vancouver 49.5
Edmonton 49.4
Anaheim 49.2
Dallas 49.2
Nashville 49.2
Montreal 49.1
Buffalo 49.0
NY Rangers 48.6
New Jersey 48.2
Minnesota 47.8
Ottawa 47.5
Arizona 46.6
NY Islanders 46.4
Columbus 46.2
Detroit 45.4
Синим выделены команды с CF% больше 50%, то есть команды с атакующим стилем игры. Зеленым выделены команды с CF% меньше 50%, то есть команды с защитным стилем игры.

Кстати говоря, Лос-Анджелес и в прошлом сезоне был лидером по этому показателю. 
Бросается в глаза отсутствие Далласа в списке атакующих. Все-таки звездные имеют ярко выраженный атакующий стиль игры и в прошлом сезоне они по этому показатлю были третьими.
Но думаю массовые травмы тому виной.  Сейчас у Далласа в список травмированных внесены: Спецца, Шарп, Гудлер, Хемски, Икин, Янмарк.  Это все форварды и форварды далеко не последнюю роль играющие в команде. Тем самым глубина, да и потенциал атаки в их отсутствие резко снижается.
Думаю, как начнет пустеть лазарет Далласа, начнет расти их CF%.

Сразу хочу отметить, что CF% никак не влияет на успешность выступления команды
(вроде бы не влияет 😃).

В доказательство приведу график, на котором представлен список команд по местам в турнирной таблице слева направо и распределение Корси в соответсвии с этим расположением.
 

Итак, как видно из графика по Корси сложно оценивать (прогнозировать) успешность команды.
Но есть одно НО.

Победитель Кубка Стэнли сезона 2015/2016 Питтсбург имел 2-й показатель CF% в лиге 52,7%.
Победитель Кубка Стэнли сезона 2014/2015 Чикаго имел 2-й показатель CF% в лиге 53,6%.
Победитель Кубка Стэнли сезона 2013/2014 Лос-Анджелес имел 1-й показатель CF% в лиге 56,8%.
Победитель Кубка Стэнли сезона 2012/2013 Чикаго имел 4-й показатель CF% в лиге 54,1%.
Победитель Кубка Стэнли сезона 2011/2012 Лос-Анджелес имел 2-й показатель CF% в лиге 54,8%.

Таким образом, все обладатели Кубка Стэнли последних лет являлись лидерами лиги по Корси.
И кстати все финалисты также имели Корси выше 50%.

PDO

Теперь разберем показатель PDO.
Напомню, что PDO = процент реализации бросков + процент отраженных бросков.

Опять же возьмем срез на текущий момент, 13 ноября 2016 года.
 

Принято считать, что нормой значения для показателя PDO является 100.
PDO многие эксперты называют не иначе как показателем везения.
То есть считается, что команды, имеющие показатель PDO выше 100, являются везунчикам, то есть их результат во многом достигнут либо запредельно высокой реализацией бросков, либо вратарем, который тащит почти все.
Соотвественно, команды с PDO меньше 100 - невезучие.

Но как-то не хочется соглашаться на эти условности в виде границы везения/невезения в 100 пунктов.

Давайте посмотрим на статистику предыдущих сезонов.

PDO 2011/2012 от 97,8 до 101,5
PDO 2012/2013 от 96,1 до 103
PDO 2013/2014 от 98 до 102,5
PDO 2014/2015 от 97,1 до 101,9
PDO 2015/2016 от 98,3 до 102,4


Как видим, за последние 5 сезонов PDO находится в диапазоне от 96 до 103.

Теперь, если обратимся к текущим показателям сезона 2016/2017 (таблица выше), то увидим, что несколько команд имеют явно завышенные значения PDO

К их числу относятся:

Chicago (105,3)
Monreal (105,1)
NY Rangers (104,9)
Columbus (104,1)
Minnesota (104)


Ни в одном из последних 5 сезонов ни у одной из команд не было столь высоких значений PDO.

То есть можно сделать вывод, что выше указанным командам пока очень сильно везет и следует ждать снижения PDO для этих клубов.

В чем же именно кроется это везение?

Как известно PDO складывается из процента реализации бросков (в таблице SH%)
и процента отраженных бросков (в таблице SV%).

Чтобы оценить норму этих показателей, вновь обращюсь к предыдущим сезонам.

SH% 2011/2012 от 6,03 до 9,73 (лишь у 2-х команд показатель был больше 9)
SH% 2012/2013 от 5,77 до 10,57 (у 4-х команд показатель больше 9, у одной команды больше 10)
SH% 2013/2014 от 5,84 до 9,83
SH% 2014/2015 от 5,72 до 9,03
SH% 2015/2016 от 6,36 до 8,95

 
Выводы:
  • За 5 лет лишь у одной команды SH% был больше 10, а именно 10,57. 
  • Единичны случаи с SH% больше 9 (8 команд за 5 лет), то есть вероятность этого события на уровне 5%.
  • Последние 4 сезона отмечается тенденция снижения SH%.
А теперь давайте вновь обратимся к нашей табличке (см. выше).

NY Rangers имеет SH% равный 12,65.
Columbus имеет SH% равный 10,39.


Это явно завышенные значения, которые будут снижаться.

Minnesota 9,93
Montreal 9,58
NY Islanders 9,09


Тоже достаточно высокие значения, расти явно не будут, скорее всего также следует ожидать снижения SH% для этих команд.

Вот мы и нашли причину так называемого везения 4 из 5 команд из списка выше.
Осталось Чикаго.

Ну а Чикаго имеет самый высокий SV% (процент отраженных бросков) в лиге и равняется он 96,41%.

Процент отраженных бросков (SV%) за последние 5 сезонов принимал значения в диапазоне
от 89% до 94%.

Так что Чикаго имеет явно завышенное значение этого показателя на текущий момент и следует ждать его снижения.

Также на текущий момент SV% завышен у Монреаля (95,55%) и Нью-Джерси (94,53%).

Таким образом, используя показатели продвинутой хоккейной статистики можно оценивать стили игры команд (по Корси); комбинируя несколько показателей определять ключевые точки успеха команд.

Например, текущий лидер лиги Монреаль занимает лишь 21-е место по Корси (CF%).
При этом имеет завышенные значения показателей PDO, SH%, SV%.

То есть Монреаль побеждает за счет сверх надежной игры Прайса, завышенной реализации бросков (которых не так много относительно всей лиги), ну и больше тяготеет к игре от обороны.

Учитывая, что целых 2 показателя (SH% и SV%) у Монреаля имеют явно завышенные значения, предположу, что команда не останется на вершине таблицы и в будущем стоит ждать их снижения (если конечно они не сделают какой-то супер скачок вперед в своей игре).

Ну и не забываем, что до финала Кубка Стэнли не доходят команды с Корси (CF%) ниже 50%)))

В общем, с помощью продвинутой статистики можно нарисовать портрет каждой команды, оценить слабые и сильные стороны, понять игровую концепцию и так далее.

Все это может быть (и должно быть) одним из элементов принятия решения о ставке на тот или иной матч.

Прошу в комментариях делиться своими мыслями на этот счет.

Если тема интересна, продолжу публиковать в блоге статьи данного направления.

ВСЕМ УДАЧНЫХ СТАВОК!!!
(кстати
прогнозы на сегодняшние матчи по хоккею опубликую чуть позже).