Хоккей, Обучение

1 год назад

Как использовать продвинутую статистику в фэнтези хоккее

Цель продвинутой спортивной статистики — как можно более точное прогнозирование будущих результатов. Помимо модели xG, о которой вы, вероятно, слышали, в хоккее есть и другие метрики. Всю эту статистику можно использовать как на уровне команды, так и отдельных игроков, однако, что касается дэйли фэнтези хоккея — командная статистика применяется чаще. В этой статье я разберу основные термины из мира продвинутой хоккейной аналитики и постараюсь объяснить, как использовать ее для получения преимущества в игре.

 

Введение

Прежде чем мы начнем, давайте проясним некоторые вещи. Не нужно быть экспертом в хоккее, чтобы понимать, что в нем есть различные игровые ситуации, такие как игра в равных составах, большинство и меньшинство. Чтобы оценить результаты в надлежащем контексте, мы оцениваем продвинутую статистику при той или иной игровой ситуации. Так как около 80% минут в НХЛ игроки проводят в равных составах, наиболее полезными для нас будут показатели игры 5 на 5.

Во-вторых, мы должны сделать корректировку «per 60», то есть на 60 минут игрового времени. Это стандартный метод оценки эффективности при больших объемах выборки в тех случаях, когда количество проведенного на льду времени будет отличаться, таким образом, оценка необработанных значений будет всегда давать искаженные результаты.

 

Corsi

Corsi — это фундаментальная концепция продвинутой хоккейной статистики. Показатель Corsi For (CF) включает в себя броски по воротам, броски, не попавшие в створ ворот, а также заблокированные попытки бросить по воротам соперника. Corsi Against (CA), в свою очередь, включает в себя те же самые броски, но уже по воротам собственной команды. 

Давайте взглянем на показатели CF/60 и CA/60 команд НХЛ за первую половину сезона:

Как мы видим, Монреаль и Торонто были лучшими командами с точки зрения созданий ситуаций для броска. Рейнджеры и Оттава были худшими, пропуская броски по воротам пачками.

Объединив Corsi For и Corsi Against, мы получим Corsi For Percentage (CF%). Это соотношение, которое показывает нам процент бросков по воротам определенной команды по сравнению с общим количеством бросков в матче при игре 5 на 5.

Corsi For Percentage в 52% и выше означает, что команда хорошо контролирует ход игры (верхняя правая часть таблицы). CF в пределах 50-52% можно считать сильной игрой, а показатели в 48-50% — слабой. Все, что находится ниже 48% — это очень слабо, эти команды находятся в нижней левой части таблицы.

В целом, Corsi является хорошим показателем команды «вести игру», но очевидно, что все броски разные, и если команда перебрасывает оппонента, то это не обязательно означает, что все эти броски качественные. Оценить качество бросков помогают следующие две метрики.
 

High-danger scoring chances

High-danger chances (или опасные моменты) — это наиболее точная метрика для оценки качества созданных моментов. Если вы знакомы с термином «опасный момент» в футболе, то в хоккее аналогом этой метрики являются HDC. High danger scoring chances for (HDCF, созданные опасные моменты) — это броски команды с определенных положений площадки, которые имеют возможность превратиться в гол. High danger scoring chances against (HDCA, допущенные опасные моменты) — те же опасные броски, но по собственным воротам команды.  

Что касается DFS хоккея, то нам более интересен показатель HDCA команды, чем ее HDCF. Мы должны стараться выбирать игроков, оппоненты которых имеют худшие показатели HDCA/60, и избегать выбора тех, которым противостоят команды с крепкими HDCA/60. 

 

Expected goals (xG)

Данная концепция используется не только в хоккее, поэтому объяснить ее проще. Модель xG назначает определенный вес каждому незаблокированному броску по воротам, основываясь на вероятности того, что этот бросок приведет к голу. Щелчок из круга вбрасывания может иметь значение xG около 0.2, в то время как кистевой бросок от синей линии может быть оценен всего лишь в 0.02.

Модель xG позволяет оценить, как много качественных голевых моментов каждая команда создает и допускает. При этом, xG и High-danger scoring chances тесно коррелируют и могут использоваться практически взаимозаменяемо.

Худшие команды НХЛ по HDCA/60 и xGA/60 в этом сезоне:

 

Место Команда xGA/60 xGF% HDCF/60 HDCA/60
1 New York Rangers 2.72 45.38 11.22 12.72
2 Chicago Blackhawks 2.59 45.73 9.85 12.58
3 Winnipeg Jets 2.54 42.93 8.11 12.5
4 San Jose Sharks 2.37 47.81 10.79 11.48
5 New York Islanders 2.26 48.32 11.13 11.33
6 Ottawa Senators 2.33 50.41 11.24 11.24
7 Washington Capitals 2.3 51.06 11.25 11.13
8 Florida Panthers 2.39 48.96 9.44 11.05
9 Anaheim Ducks 2.45 47.63 11.09 10.98
10 Toronto Maple Leafs 2.31 50.70 10.73 10.84

* Источник: naturalstattrick.com

 

Используя CA/60, xGA/60 и HDCA/60 в связке, вы сможете определить команды, которые вам, скорее всего, следует выделить в том или ином слейте. Следует отметить, что для более репрезентативных результатов вам следует ограничить выборку. Я предпочитаю анализировать данные только за последний месяц.

 

PDO

Цель PDO — определить, была ли команда удачливой или неудачной в прошедших матчах. PDO — это сумма процента реализованных бросков команды (процента бросков в створ ворот, которые стали голом) и процента ее отраженных бросков (процент бросков по воротам команды, которые отразил вратарь). Среднее значение в НХЛ равняется в точности 1.000

Высокий процент PDO команды будет означать оверперформинг (команде везет) и грядущий регресс к среднему значению. Низкий PDO, соответственно, означает андерперформинг (команде не везет). 

Взгляните на PDO команд НХЛ в этом сезоне в следующей таблице:

У Колорадо (1.027) и Бостона (1.022) самые высокие значения PDO за первую половину сезона. Причинами тому являются превосходные вратари и высокий процент реализованных бросков. Сан-Хосе (0.974), Детройт (0.968) и Лос-Анджелес (0.976) — самые невезучие. Неудачи Сан-Хосе можно объяснить крайне неудачной игрой вратарской линии, в то время как Детройт и ЛА были плохи в реализации бросков.

Следует отметить, что PDO в дэйли фэнтези используется реже. Модель более долговременна по своей природе и качество игры вратарей тоже существенно влияет на показатели. Однако, мы можем ожидать некоторого регресса к среднему в отношении процента реализованных бросков.
 

Заключение

В данной статье мы рассмотрели основы аналитики продвинутой статистики в фэнтези хоккее. Мы обсудили использование их на командном уровне, однако теперь вы можете начать самостоятельно анализировать отдельных игроков и звенья. Методология будет той же. Однако, стоит помнить, что хоккей по своей природе является видом спорта с большой долей случайности. То, что мы обсудили сегодня, не сделает вас успешным игроком в дэйли фэнтези хоккей за одну ночь. Однако, большинство игроков на FanTeam не использует продвинутую статистику при составлении команд и на дистанции знания, полученные в этой статье, дадут вам весомое преимущество.

Khan
Автор

Khan

Khan, a Ph.D. student in Economics, loves studying advanced sports analytics and using it to his advantage in DFS. Having started to play daily fantasy sports in 2017, he currently has a net profit of over 30000 euros. Sits in the top-3 of DFS-hockey players in Europe, finished 3rd in FanTeam's World Championship of Fantasy Football 2018.