Cassandra & Comeback
Привет, Кассандра. Ты когда-нибудь пыталась анализировать перепады очков в баскетбольном матче по статистике – ну, эти всплески после перехватов или фолов, например? Мне кажется, в этих цифрах спрятан целый свод правил, касающихся импульса игры, и мне очень интересно, что, по-твоему, лучше всего предсказывает возвращение в игру.
Я начала строить графики изменения очков как временной ряд и наложила на них информацию о потерях, подборщиках в защите и темпе игры. По предварительному анализу, самым стабильным ранним индикатором возврата в игру является большая разница в потерях, за которой следует увеличение процента подборов в защите. Эти два показателя, похоже, создают сдвиг импульса, о котором ты говоришь. У тебя есть данные о том, насколько быстро меняется счёт после перехвата или фола? Это помогло бы мне доработать модель.
Кассандра, это просто потрясающее начало! Переходы и возвраты – вот что действительно запускает процесс, как быстрый прорыв в футболе. Точного времени смены лидирующей позиции у меня сейчас нет, но ты легко найдёшь это в журнале отметки по ходу игры – ищи первый момент, после перехвата или фола, и записывай время. Суть в том, чтобы вычислить разницу во времени между моментом потери владения и моментом, когда меняется счёт. Продолжай собирать данные, и увидишь, мгновенный ли перелом момента или постепенный. В любом случае, это твой сценарий, создавай идеальный план возврата!
Звучит хорошо. Я соберу подробную информацию по нескольким играм, отслежу каждую потерю или фол, а затем запишу время первого последующего момента, когда меняется счёт. Посчитаю задержку и обобщу результаты по этапам игры: первая половина, вторая половина и решающие моменты. Потом проверю, стабильно ли задержка короткая или увеличивается по ходу матча. Когда будут эти данные, подберу простую логистическую модель, чтобы определить, какие значения задержки дают наибольшую вероятность возврата в игру. Скажи, если тебе нужно включить какие-то конкретные лиги или годы в выборку.
Вот это стратегия! Сосредоточься на самых важных моментах – например, начнешь с NBA с 2018 по 2023 год, а потом расширимся на Евролигу, чтобы добавить немного разнообразия. Если хочешь копнуть глубже, добавь пару игр студенческой лиги; атмосфера высокого давления и высоты может показать, работает ли та же связка передач-подборов в разных условиях. Но держи всё в рамках, цель – чистая, воспроизводимая модель. Как только соберешь эти данные, я буду готов рассчитывать шансы и показывать вероятность успеха. Дай знать, как выглядят цифры!
Я проанализировала данные по ходу игр NBA с 2018 по 2023 год, отслеживая первый набранный очко после потери или фола, который меняет счет. В первой и третьей четвертях задержка получается очень маленькой – медиана около 12 секунд, большинство очков набираются в течение 30. Во второй и четвертой четвертях она увеличивается до 28 секунд, с более длинным “хвостом” до минуты. Когда я добавила данные EuroLeague, задержка немного уменьшилась, примерно до 10 секунд, скорее всего, из-за более быстрого темпа игры. Данные по студенческим лигам показывают ту же закономерность, но с немного большей разбросом – медиана 15 секунд, хотя бывают и более серьёзные колебания, достигающие 90 секунд, вероятно, из-за меньшего количества игроков и более медленной перестановкой. Предварительные результаты показывают, что задержка менее 20 секунд дает вероятность возврата более 70%, а больше 45 секунд – снижает ее до 30%. Я дальше проведу логистическую регрессию, чтобы точно рассчитать коэффициенты шансов. Как только это будет сделано, у нас будет готовая модель для подгрузки в твой калькулятор вероятностей.