«Мы научились рассчитывать вероятность исхода матчей». Что такое аналитический продукт биржи Si14
Компания разработала собственное решение в футбольной аналитике.
Готовящаяся к запуску биржа ставок на спорт Si14 заявляет, что её футбольный аналитический продукт нацелен на прорыв в беттинговой индустрии. Руководитель аналитического отдела компании Алексей Трипутень объясняет, что это за зверь и как его использовать на практике.
От сырых данных — к трактовке цифр
— В чём суть вашего аналитического решения?
— Мы постарались вдохнуть новую жизнь в огромные массивы данных, которыми сейчас является футбольная статистика. Задумались однажды над тем, что аналитические компании умеют обсчитывать каждое действие игрока, но не готовы предоставить потребителям прикладные рекомендации. Получатели статистики видят информацию о пасах, отборах, ударах, единоборствах, но всё это почти не характеризует футболистов в практическом смысле. Их полезность определяется на глазок либо по прямым бомбардирским показателям вроде голов и результативных передач. Однако футбол — сплав качеств как отдельного игрока, так и сформированной из игроков команды. Есть очень одарённые футболисты, которые вредят командным действиям. И наоборот, незаметные герои часто вытаскивают на себе тяжёлые матчи.
Это натолкнуло нас на мысль перейти от сырых данных, предлагаемых компаниями по сбору статистики, к аналитике на основе искусственного интеллекта, до сих пор почти не применявшейся в футбольной индустрии. От набора цифр по 211 федерациям, 130 тысячам футболистов, огромному количеству клубов — к качественной трактовке этих цифр, выполненной на основе компьютерных технологий.
— Что за качественная трактовка?
— Фактически мы придумали способ понять, не копаясь в куче таблиц, хорош ли футболист вообще и в конкретных обстоятельствах в частности. В чём его слабые и сильные стороны. Насколько он совместим с той или иной тактикой, лигой, командой. Как на прогресс или регресс игроков влияют тренеры, смена клуба, травмы и даже свадьбы.
Используем те же сырые данные, но по своим математическим моделям и в своей интерпретации. Для начала с помощью искусственного интеллекта выявили три составляющих, из которых складывается оценка любого футболиста: способность атаковать, обороняться и качество его работы с мячом. Затем учли долю действий игрока в перформансе всей команды, стабильность на протяжении матча, турнира и карьеры, а также баланс главных составляющих, помогающий различать одноплановых и универсальных исполнителей. По отдельности это не даёт полной картины, работает только в увязке.
— Что-то подобное наверняка пытались сделать и другие. В чём ваше ноу-хау?
— В том, что мы придумали усреднённые цифровые портреты для разных амплуа, лиг и стилей игры, так называемые лекала. Сначала обработали около тысячи игроков, выявив у каждого более ста наиболее важных метрик. Каждый следующий массив данных уточнял и корректировал наши лекала, в базе появлялось всё большее число футболистов. В итоге пришли к тому, что компьютер, применяя шаблоны, точно знает, хорош игрок для конкретных условий или нет.
Приведу в пример Джона Стоунза из «Манчестер Сити». При линейном подходе компьютерная программа сочтёт, что он проседает в единоборствах. Хотя Джон — топовый защитник с присущими этому амплуа элитными качествами. Проанализировав другие лиги, мы нашли ещё несколько сильных защитников, не показывающих высоких цифр по единоборствам. И выяснилось: все они играют в командах, которые владеют на поле подавляющим преимуществом. Без давления соперников защитники не вступают в тот объём единоборств, который необходим для обсчётов. Более того, тренеры активно используют таких защитников для продвижения мяча и участия в атакующих действиях. Поэтому типовая программа запишет их в слабые в оборонительном компоненте. А алгоритм Si14 выделит этот случай в отдельный, сформирует лекало и в схожих ситуациях станет его применять.
— На основании какого объёма данных формируются ваши лекала?
— Каждую неделю в мире играется 1,5—2 тысячи футбольных матчей. В каждом матче происходит около двух тысяч статистических событий. За семь дней наш компьютер обновляется на четыре миллиона показателей. Много? На самом деле нет, если сравнивать, например, со страховым или финансовым бизнесом. А мы не только сравниваем, но и применяем систему оценки, используемую в страховом бизнесе. Называется она «деревом решений» и представляет собой разветвлённую логическую классификацию. Каждый футболист проходит через сито сравнений с идеальным шаблоном и одновременно делает его ещё точнее.
— Как пользователь вашей биржи может увидеть итоги работы искусственного интеллекта?
— Гордимся тем, что придумали визуализацию оценки игроков — индекс Si14. Это так называемые тетраэдры: компьютерная графика, позволяющая зрительно оценить сложные футбольные компоненты.
Наш тетраэдр и есть статистический портрет футболиста, выполненный в минималистичном ключе. Простой геометрический код, имеющий понятную цветовую гамму. Уход в зелёное — признак качества, красное — недостатков. Длинная грань — сильная сторона игрока, короткая — не очень. Вид тетраэдра характеризует уровень любого футболиста. Если же нужна расшифровка, все части индекса Si14 кликабельны и готовы отправить пользователя в яркое цифровое путешествие.
— Шаблоны футболистов, «оцифровка» и визуализация их мастерства — разве в компьютерных симуляторах футбола, типа FIFA, такое не применяют уже десятилетиями?
— Применяется, конечно, вся разница в том, что наша оцифровка — все цифры и данные, которые вы увидите на нашей платформе, — основана не на фантазии разработчиков симуляторов и их восприятии футбола, а на реальных данных, которые игроки «зарабатывают» на футбольном поле. А визуальная часть, например, наш тетраэдр, длина его рёбер, объём шариков на углах, цветовое кодирование — зелёное, жёлтое, красное — способ визуального восприятия этих данных.
Как этим пользоваться в беттинге
— А теперь самое главное — как применять ваши тетраэдры и зачем всё это беттору?
— От индексов игроков мы пришли к индексам клубов и лиг, рассчитываем их с той же глубиной и точностью. На основе этого родилось решение, позволяющее оценивать вероятность исхода матчей, количества голов, заработанных угловых, в общем, всех составляющих матча. Только наша оценка опирается не на титулы или историю взаимоотношений, не на субъективную оценку аналитиков, выстраивающих коэффициенты вручную, а на реальную футбольную силу обсчитываемых объектов прямо сейчас. Это онлайн-срез, статистическая выжимка предстоящего матча.
Конечно, всё это плотно коррелируется с нашей основной деятельностью — беттингом. Сегодня подавляющее большинство БК применяют, по сути, одну бизнес-модель: покупают событийность и линии от Betradar, StatsPerform или идут к специализированным компаниям типа OpenBet, предлагающим ПО для автоматического формирования линий. Дальше на готовые коэффициенты накручивается своя маржа. Формирование линий происходит на основе исторической базы данных и субъективных мнений аналитиков. Такая модель имеет большую погрешность, но риск проигрыша БК покрывается как раз за счёт маржи и корректировки линий после начала ставок. Простыми словами, если даже БК дала некорректную линию, видя реакцию рынка, она просто изменяет коэффициенты.
У нас принципиально иной подход. Наша модель формирует линии на основе глубокой аналитики с участием искусственного интеллекта и не имеет аналогов. Если давать ей название, то остановился бы на формулировке «расчёт истинных коэффициентов».
— А можем привести пример? Вот у нас 5 февраля в АПЛ матч «Бернли» — «Уотфорд». Какие у вашей системы коэффициенты на эту игру?
— Коэффициенты — лишь производная от нашей оценки вероятности исхода матча. Важно понимать, что мы не оракулы, мы не нашли священный Грааль, который предсказывает исходы матчей, — это невозможно по объективным причинам. Мы считаем, что наша система оценки игроков, команд, вероятности исхода игр глубока, объективна и является как минимум конкурентной к существующим оценкам, поскольку на сегодняшний момент историческая дата, применяемая в формировании коэффициентов, часто не является корректной оценкой. Объясню на примере.
Больше 80% переходов в профессиональном футболе осуществляется без оплаты трансфера. То есть игроки стараются подписывать краткосрочные контракты, чтобы быстрее поменять клуб. Мотивация их понятна: если за тебя не надо платить другому клубу, то можно попросить эти деньги себе в качестве подъёмных или за их счёт увеличить заработную плату. Такая система приводит к тому, что большинство клубов ежегодно обновляют свои составы почти наполовину, а часто и полностью. Какую пользу может принести историческая дата, история противостояния двух клубов, если в этом году составы команд совершенно иные? В нашей системе координат мы идём от частного к частному, оцениваем конкретных игроков, которые будут играть в конкретном матче.
История из жизни в подтверждение моих слов. Текущие лидеры чемпионатов Бельгии и Кипра, клубы «Юнион» и «Арис», в прошлом сезоне выступали на дивизион ниже. Перейдя в топовые дивизионы своих стран, они, по исторической оценке, являются записными андердогами, однако клубы обновили полностью свои составы и оказались настолько конкурентны, что экватор турниров закончили в лидерах. Наша система оценки определяла бы их силу корректно с первого же тура.
— Вашу линию полностью формирует искусственный интеллект или команда трейдеров тоже есть?
— Работает искусственный интеллект. Система полностью автоматизирована, человек в ней нужен только для исполнения контролирующих функций — следить, чтобы всё работало как следует.
— Если ваша линия будет отличаться от линий других поставщиков, то возможны вилки. Но насколько я помню, возникновения вилочных ситуаций вы не боитесь.
— Мы биржа ставок, а не БК, поэтому изначально заинтересованы, чтобы спор клиентов прошёл в максимально честных условиях, то есть при справедливых, «истинных коэффициентах».
Не хотим, чтобы у нас возникали перекосы, вызванные объёмом ставок. Типовые букмекерские линии подвержены влиянию массы факторов, от нелепых слухов до выступлений блогеров. Кто-то где-то разогрел линию, и она моментально набухает, становится не объективной, а конъюнктурной. Но не у нас. Мы хотим попробовать другой путь: использовать для выстраивания коэффициентов математическую модель. Не следовать за деньгами, а опираться на знание. Используя Si14, капперы получат возможность руководствоваться сугубо футбольными доводами и не зависеть от чужого хеджирования или, к примеру, влияния СМИ.
— Итак, вы утверждаете, что у вас есть инструмент, позволяющий корректнее рассчитывать вероятность спортивных событий. Верно?
— Совершенно верно. Он базируется исключительно на статистике, обработанной по логичному, понятному алгоритму. Готовы вооружить этим инструментом тех, кто имеет дело со ставками на спорт, будь то обычные болельщики или аналитические компании.
— А зачем условному Betradar платить вам?
— Всё очень просто: такие компании заинтересованы в том, чтобы предоставлять своим клиентам более качественную линию, без перекосов и ошибок. Получая наши данные, они получают улучшенный продукт, который гораздо точнее отражает действительность. Как я уже сказал, есть очень серьёзный интерес со стороны поставщиков. Естественно, называть конкретные компании я не могу.
Искусственный интеллект знает, как думали другие
— Понимаю, что вопрос не совсем к вам, аналитику, но всё же: а стоит ли всё это того? Несколько лет разработки, затраты — в то время как с точки зрения биржи ваши коэффициенты — не более чем ориентир для пользователей. Не увеличили ли вы этим себе срок выхода на самоокупаемость?
— Дело в том, что изначально платформа создавалась как продукт для профессиональных футбольных клубов. На её разработку потратили порядка трёх лет. Подключив софт к ИИ, мы поняли, что можем ставить перед собой более масштабные задачи. Таким образом, ареал применения нашего ПО теперь может охватывать и беттинг, и профессиональные клубы. Причём с клубами мы работаем в широком диапазоне: от селекции до помощи в определении стартовых составов с привязкой к сопернику. С нашим продуктом болельщики могут отследить, как меняются игроки их любимой команды за любой период времени; президент клуба — как повлиял на команду приход нового тренера. Доступен любой период мониторинга, это позволяет отследить динамику процессов. Клубные аналитики, скауты, агенты тоже в числе интересантов, каждый найдёт в индексе Si14 полезную информацию.
Искусственный интеллект не думает, но знает, как думали другие, и потому идёт к цели кратчайшим путем. Кстати, ещё один индекс, над которым работаем, — тренерский. Есть множество метрик, характеризующих людей этой профессии. И много параметров, позволяющих вывести статистические шаблоны для сравнений.
— У вас сейчас только футбольная аналитика?
— Не только: если людей влекут гандбол, лошадиные бега или матчи второго финского дивизиона, у нас они смогут получить статистически обоснованные рекомендации в виде кнопки «Аналитика» возле каждой линии коэффициентов. С полным раскладом по лигам, командам и игрокам.
С футбола мы начинали. Отработав алгоритм, решили посмотреть по сторонам. Сейчас контактируем с западноевропейской компанией, одним из лидеров индустрии по сбору ивент- и фитнес-данных в различных видах спорта. Они начали обсчитывать всё это пять лет назад и далеко продвинулись в гандболе, волейболе, баскетболе. Нам осталось лишь применить их данные в наших оценочных алгоритмах.
— А в киберспорте перспективы имеются?
— Есть мысли на этот счёт. Не исключено, что кибернаправление может стать приоритетным. Болельщики всё больше уходят в онлайн, большую популярность в мире завоевывает Fantasy football, где каждый может попробовать себя в роли руководителя клуба, тренера. Для таких платформ наша модель реальной оценки футболиста просто незаменима. С продуктом Si14 геймеры получат возможность ранжировать футболистов по конкретным метрикам. Это автоматически заострит вопрос виртуальной стоимости, трансферных бюджетов, горизонтов применимости. Знание силы игроков и клубов, выраженное в цифрах, позволит пользователям игровых платформ заработать деньги. Мир футбольных симуляторов, в свою очередь, наполнится новым смыслом и доведёт скиллы любителей футбола до реального профессионального уровня.
— «Позволит пользователям игровых платформ заработать деньги» — вы позиционируете ваш продукт как инструмент зарабатывания?
— Нет, мы позиционируем наш продукт как рабочий инструмент. Это условный Айфон в ваших руках. Кому-то он нужен для работы, кто-то любит пообщаться с друзьями, кто-то — поиграть в игры.
— Ну и последнее: Виктор Копылов давал нам интервью почти год назад. Когда же наконец состоится запуск вашей биржи и почему всё так тянется?
— Не будем проводить аналогию с вином, которое чем больше выдерживается, тем лучше становится. У нас нет задачи как можно быстрее выйти на рынок — есть текущие задачи, которые в рамках реализации такого многоуровневого, сложного продукта, как биржа ставок на спорт, требуют максимальной проработки и детализации. Мы готовим много инновационных решений, существует множество важных нюансов, о которых стоит позаботиться прежде, чем разбивать бутылку шампанского о борт нашего корабля. Но до отплытия осталось совсем недолго.
Читайте также: