Дарова, Вастрикяне!
Прочитал нашумевшую статью про оверсинкинг и решил, что нужно взять и на коленках накидать то, что давно обещал.
А обещал я постик по футбольной аналитике (для новичков с нуля без регистрации без смс). Ну лан, погнали, сделаем обзорную экскурсию вместе с маэстро футбольной аналитики Александром Бубновым. Чтиво лайтовое, без перенасыщения терминами - надеюсь будет понятно и тем, для кого футбол - это "какие-то пацаны мяч пинают"
В общем, че я писать то буду:
- Че за данные тут вообще крутятся
- Основной мем по этой тематике
- Где тут мошин лернинг
- Самые топовые юзкейсы
- А че по комьюнити
Ну шо, погнали?
Data-driven foootbisss
Ну кто больше забил - тот победил, че тут щитать то???
Ну да, в футболе мы обычно считаем голы и в рамках одной игры ничего лучше нету - очки дают за то, что ты больше соперника забил, а не за то, что офигенно играл. На этом выезжали и выезжают мильоны тренеров, которые берут супер оборонительную тактику и просто никак не дают сопернику забить. Принцип простой: не пропустил = не проиграл, а еще мб какой-то шальной гол забьешь (привет от Бердыева и Евсеева).
По сути, забитые голы - это самая главная метрика, которую максимизирует каждая футбольная команда. Но блин, нельзя сказать: "я хочу забивать на 1 гол больше соперника в каждом матче", так же как нельзя сказать: "я хочу вдвое увеличить LTV продукта". Поэтому нужно копать глубже и понимать, что можно улучшить.
Первые продвижение - меримся хм-хм ударами и нарушениями
Ну вот, "голы считать - какой-то зашквар" подумали люди много-много лет назад. И начали считать удары, угловые, нарушения, процент владения мячом - в общем верхнеуровневые метрики, которые позволяют понимать, кто как играл: кто больше бил, владел мячом и нарушал правила.
По сути, вроде полезно, понимаешь расклад сил. Но ценность отдельных игроков по-отдельности не особо оценишь... А еще удар удару рознь, желтая карточка желтой карточке - один может пробить 1 раз за матч и забить, другой может лупить 20-30 раз с плохих позиций и уйти с нулем голов (Кирилл Панченко, хеллоу). А ЕЩЕ ДАННЫХ ДЛЯ ML МАЛО!!!!!! Ну и ситуации как на скрине ниже - вооообще не редкость.
Давайте нормальные данные посмотрим!!! Нет, пока мемы посмотрим
Нужно копать глубже, Копатыч. И тут люди начали считать больше событий на футбольном поле. И тут краткий экскурс в главного героя обзора. Есть такой человечек, Александр Бубнов, который начал считать ТТД (технико-тактические действия) игроков. Что же это такое? Давайте я просто процитирую мясопедию
ТТД Бубнова – показатели технико-тактических действий, рассчитанные гуру отечественной аналитики в ходе полночных бдений и бубнений с бубном. По горячему убеждению Бубнова, все те аналитические выводы, которые он сделал на основании полученных цифр ТТД, – есть абсолютная и непреложная истина в последней инстанции, малейшие сомнения в которой являются тягчайшим преступлением перед мировым футболом
и должны караться смертью. Естественно, что у российских болельщиков слова "Бубнов" и "ТТД" стали практически синонимами: ибо мы говорим "Бубнов" – подразумеваем "ТТД", мы говорим "ТТД" – подразумеваем "Бубнов".
По сути ТТД - это просто количество всех действий, которые совершил игрок. Если их было много, а процент неудачных (процент брака) маленький, то игрок сыграл хорошо. Иначе - ДУОЙКА
Ну лан, давай адекватно
Идею ТТД развили, систематизировали, и начали записывать детали ВСЕХ событий на футбольном поле: Вася Пупкин отобрал мяч у Васи Уткина, который в это время ЗАСТРЯЛ В ТИНЕ. И таким образом люди считают:
- все единоборства (кто, с кем и где)
- перехваты (кто, у кого, как и где)
- пасы (кто, кому, куда, каким образом)
- удары (кто, откуда, куда, какой частью тела, насколько успешно)
- и вообще все события на футбольном поле, которые можно к конкретному моменту времени привязать (у Вани развязался шнурок, Саша послал Артема сами знаете куда, а Дима призвал надругаться над мясом - возможно некоторые и это считают:))
(вот один из самых классных датасетов с такими данными)
Основная польза от таких данных - более полное представление о течении матча, о действиях конкретных игроков и каким образом была достигнута статистика из пунктов выше (такой аналог среднеуровневых метрик продукта). А еще тут тебе и объем данных для ML (на которых считается xG, xP, g+ и многие другие метрики с мошинным лернингом, про которые я напишу при наличии интереса аудитории).
Пример: Команда использовала много длинных передач с маленькой точностью, много раз вступала в отбор, и била по воротам соперника очень редко, но с хороших позиций - значит, вероятно, она парковала автобус (в переводе на человеческий: весь матч плотно обороняла свои ворота, без особых мыслей атаковать) и изредка выбегала в контратаки. Это обычно выражается в малом проценте владения мячом и малом количестве забитых обеими командами голов, что можно заметить на более верхнеуровневых метриках
Это ж не все? Нет, конечно
Гики на этом не остановились и поняли, что можно еще изучать КАК игроки ДВИГАЮТСЯ на поле, тут же тоже много инфы можно вынести. И тут появилась *tracking data* - с частотой в доли секунды записываются все положения игроков и мяча, на основе чего можно столько всего прикольного посчитааааать. Данный уровень данных дико низкоуровневый - с ними можно много всего сделать, но это либо для гиков, либо для нейросеток (с помощью которых, к слову, дофига пользы получают). Не буду глубоко копать, тут целый длиннопост нужен на эту тему.
Приведу пример юз-кейса: например, с помощью трекинг-даты такие красивые диаграмки строят и моделируют разные состояния футбольного матча.
А кому-то эти данные помогали? Ой, да еще как...
Так, ребят, за ночь я этот текст не успел накидать, завтра на работу вставать, а запостить надо сегодня (оверсинкинг иначе эту статью убьет). Так шо напишу тезисно:
- Мидтьюллан поднялся из низов и тупа выиграл чемпионат за счет данных и машинки для скаутинга игроков
- Для менеджеров клубов сделали чисто социальную сетку, где они могут игроков изучать и договариваться об их покупке
- А еще конторка Инстат, которая описанные выше данные поставляет, предположительно (но не факт) продает историю просмотров важных пользователей, из-за чего информация о трансферах клубов быстро сливается в медиа (например, представитель ЦСКА жаловался, что его историю просмотров слили и про его планы по усилению узнал весь мир)
- И много много всего крутого, что я не успел написать (заинтересовал, а?))))
По комьюнити
Есть супер классный канал на ютубе, Friends of Tracking называется. Вокруг этого канала сформировалось сообщество гиков, но оно чет как-то мертвое.
И сейчас я в поиске единомышленников и комьюнити (пишу диплом по этой тематике, да и вообще, интересно же обсудить иксджи Чалова или свои достижения в Football Manager). И тут скорее совет нужен. Куда идти???
- На спортсе колонку открыть
- Канал + чатик в телеге
- Мб еще что-то?
Буду дико благодарен, если кто посоветует по построению такого узкого комьюнити, либо выразит желание развиваться в этой теме вместе.
Ну и пишите, что интересно, и про что дальше писать, а то оверсинкинг меня щяс поглотит с мильоном тем.
Не думал, что увижу в клубе мемы с Бубновым и упоминание xG. Предлагаю в честь этого отправить Спартак в пердив!
Привет! Классная статья, и я как раз из Спортса :)
Если нужна будет помощь с колонкой у нас пингуй, ну и в принципе если захочется на тему ML и спорта потрындеть, можем собраться как-нибудь (у нас есть фанаты и того, и другого).
Думаю, для единомышленников надо чатик в тележке (зови сразу), плюс пиши блог на Спорц, почти уверен, что тема будет пользоваться популярностью:;)
Глупый вопрос - как собираются сырые данные по каждому футболисту? Браслетов у них нет на ногах, как у лыжников и биатлонистов. Ручками кто-то считает вносит? По видеозаписи трекают?
как выигрывать в фентэзи?
😱 Комментарий удален его автором...