Пару слов об xG или почему «Спартак» так слабо начал новый сезон
Всем привет!
Череда европейских национальных чемпионатов набирает обороты. Уже на этой неделе, после старта Бундеслиги, Серии А и Примеры, мы получим полный пасьянс клубного футбола. Уже сейчас следует много превью и прогнозов специалистов, в том числе и на нашем сайте. Я не буду стоять в стороне и тоже постараюсь делиться своими наблюдениями. Сегодня решил зайти с новомодной стороны – темы xG. Причиной тому послужило слабое выступление «Спартака» в стартовавшем сезоне. Сейчас это стало главной темой в спортивных СМИ России, на ней спекулируют и стараются лишний раз хайпануть абсолютно все. Ведь только болельщики народной команды поднялись с колен и начали привыкать к победам, как тут же получили обухом по голове - невнятный старт любимой команды в РФПЛ, а потому и туманные перспективы на евроосень.
Причин выделяют несколько - слабый запал от тренера Карреры, травма опорника Зобнина, усталость возрастных лидеров, отсутствие кадровых усилений для не самого сильного состава лиги. С каждой причиной безусловно можно согласиться, но мне кажется, что есть еще один нюанс о котором стоит поговорить. Прошлой осенью я уже писал большой пост об xG, а также упоминал промежуточные показатели с небольшим прогнозом того, как команды закончат сезон. В частности в РФПЛ я предсказывал подъем «Крыльям Советов» и «Локомотиву», а также спад «Спартаку», «Анжи», «Амкару». Если посмотреть по итогам чемпионата, то кажется, что прогноз был неудачным, КС – вылетел, «Спартак» стал чемпионом России.
Однако уже весной, когда я продолжал следить за xG и изучать эту тему, то подумал о том, что для этого показателя все-таки важна дистанция. Законы средних цифр и математического анализа требуют время для сбора данных, а потом необходим еще значительный отрезок времени, чтобы получить близкие результаты к своим ожиданиям.
Потому данная модель, если рассматривать ее для прогнозирования роста или падения команды, больше подходит для лиг, где в календаре 60 игр и больше (КХЛ, НХЛ, НБА). В футболе календарь чемпионата охватывает меньшую дистанцию, а потому уместней прогнозировать спад или рост команды уже на следующий сезон, естественно при условии сохранения костяка команды и тренерского штаба. Дистанции текущего сезона недостаточно.
Что мы видим сейчас, явный спад у «Спартака», «Анжи» и «Амкара», а подъем у «Локомотива» - как раз все те команды, что фигурировали в обзоре девять месяцев назад, за исключением вылетевших «крылышек».
Если продолжить наблюдения за стартовавшей АПЛ, то судьбу «Спартака» должен повторить «Челси».
У них тоже существенный перебор наблюдался по ходу прошлого чемпионского сезона. Немного лишнего взяли «ВБА» Тони Пулиса, а также лондонские «Тотенхэм» и «Арсенал». Самый существенный недобор очков у «Кристал Пэлес», но там сменился тренер, а потому эти данные могут идти уже с существенной погрешностью и по КП выводы делать опасно.
Конечно, теория прогнозов и анализа на основе xG относительна и требует серьезной проработки, особенно, что касается ставок на спорт. Прошлый сезон показал, что напрямую использовать данные xG, прогнозируя матчи каждого тура не имеет смысла и приведет к рандомным результатам, где будет лишь имитация анализа. Здесь скорее можно определить тенденцию, получить некий маячок того, что может быть через некоторое время, что эта команда повышенного риска. Именно к такой категории сейчас можно отнести «Спартак» и «Челси». Похоже, пришло их время отдавать долги за сверхуспешный прошлый сезон.
На этом все, следите за обновлениями.
Череда европейских национальных чемпионатов набирает обороты. Уже на этой неделе, после старта Бундеслиги, Серии А и Примеры, мы получим полный пасьянс клубного футбола. Уже сейчас следует много превью и прогнозов специалистов, в том числе и на нашем сайте. Я не буду стоять в стороне и тоже постараюсь делиться своими наблюдениями. Сегодня решил зайти с новомодной стороны – темы xG. Причиной тому послужило слабое выступление «Спартака» в стартовавшем сезоне. Сейчас это стало главной темой в спортивных СМИ России, на ней спекулируют и стараются лишний раз хайпануть абсолютно все. Ведь только болельщики народной команды поднялись с колен и начали привыкать к победам, как тут же получили обухом по голове - невнятный старт любимой команды в РФПЛ, а потому и туманные перспективы на евроосень.
Причин выделяют несколько - слабый запал от тренера Карреры, травма опорника Зобнина, усталость возрастных лидеров, отсутствие кадровых усилений для не самого сильного состава лиги. С каждой причиной безусловно можно согласиться, но мне кажется, что есть еще один нюанс о котором стоит поговорить. Прошлой осенью я уже писал большой пост об xG, а также упоминал промежуточные показатели с небольшим прогнозом того, как команды закончат сезон. В частности в РФПЛ я предсказывал подъем «Крыльям Советов» и «Локомотиву», а также спад «Спартаку», «Анжи», «Амкару». Если посмотреть по итогам чемпионата, то кажется, что прогноз был неудачным, КС – вылетел, «Спартак» стал чемпионом России.
Однако уже весной, когда я продолжал следить за xG и изучать эту тему, то подумал о том, что для этого показателя все-таки важна дистанция. Законы средних цифр и математического анализа требуют время для сбора данных, а потом необходим еще значительный отрезок времени, чтобы получить близкие результаты к своим ожиданиям.
Потому данная модель, если рассматривать ее для прогнозирования роста или падения команды, больше подходит для лиг, где в календаре 60 игр и больше (КХЛ, НХЛ, НБА). В футболе календарь чемпионата охватывает меньшую дистанцию, а потому уместней прогнозировать спад или рост команды уже на следующий сезон, естественно при условии сохранения костяка команды и тренерского штаба. Дистанции текущего сезона недостаточно.
Что мы видим сейчас, явный спад у «Спартака», «Анжи» и «Амкара», а подъем у «Локомотива» - как раз все те команды, что фигурировали в обзоре девять месяцев назад, за исключением вылетевших «крылышек».
Если продолжить наблюдения за стартовавшей АПЛ, то судьбу «Спартака» должен повторить «Челси».
У них тоже существенный перебор наблюдался по ходу прошлого чемпионского сезона. Немного лишнего взяли «ВБА» Тони Пулиса, а также лондонские «Тотенхэм» и «Арсенал». Самый существенный недобор очков у «Кристал Пэлес», но там сменился тренер, а потому эти данные могут идти уже с существенной погрешностью и по КП выводы делать опасно.
Конечно, теория прогнозов и анализа на основе xG относительна и требует серьезной проработки, особенно, что касается ставок на спорт. Прошлый сезон показал, что напрямую использовать данные xG, прогнозируя матчи каждого тура не имеет смысла и приведет к рандомным результатам, где будет лишь имитация анализа. Здесь скорее можно определить тенденцию, получить некий маячок того, что может быть через некоторое время, что эта команда повышенного риска. Именно к такой категории сейчас можно отнести «Спартак» и «Челси». Похоже, пришло их время отдавать долги за сверхуспешный прошлый сезон.
На этом все, следите за обновлениями.
Однако, кое-какие погрешности есть. Аналитики говорят, что опасный момент априори заканчивается ударом, но это не всегда так. Бывают игроки просто мажут из хороших ситуаций. Хотя, такое должно на дистанции нивелироваться. Ну и бывают, что удар переоценён. Например, последний гол Уотфорда Ливерпулю. Там, вроде была выставленна высшая оценка за удар.
Ну и есть чемпионаты, которые слабо поддаются по XG-анализ. Например, МЛС. Там бывают матчи, что у команды 3+ XG и ноль голов. А бывают матчи, где куча голов, но по карте обе команды едва ли наиграли на голы.
Сам активно юзают https://twitter.com/11tegen11 . Парень старается, много матчей из разных чемпов, можно попросить матч, если на whoscored.com есть "чалкборда"(насколько знаю, что считают по ней). Сам недавно просил у него матч Ингольштадт - Унион Берлин. Сам сижу, "подкачиваю" медия с твиттера себе на комп. Жаль, что ограничение по количеству твитов не знаю, как преодолеть, поэтому только архив с начала года.)
Есть ещё сообщество блокнот в VK, там тоже карты выкладывают, ну и полезную статистику и наблюдения могут скинуть на обсуждение.
А вообще, все юзают "чалкборды" с хускора, поэтому можно и свою модель "набросать", если, конечно, в программировании шаришь и тебе не достаточно готового материала.