Le air renfrogné de Cristiano Ronaldo a fait la une des journaux en octobre lorsque la star portugaise a été remplacée à 18 minutes de la fin d’un match entre Manchester United et Newcastle. Mais une telle réaction n’est pas exclusive à Ronaldo : peu de footballeurs sont d’accord lorsque leur entraîneur décide de les envoyer sur le banc et d’introduire un remplaçant.

Lors de la Coupe du monde qui se déroule au Qatar, les joueurs ont plus d’arguments pour défendre leur présence sur le terrain. Peu de temps après le coup de sifflet final, les organisateurs du tournoi envoient à chaque joueur un bilan détaillé de sa performance. Les attaquants peuvent montrer combien de leurs mouvements ont été ignorés, et les défenseurs ont des données pour montrer comment ils ont harcelé l’équipe adverse lorsqu’ils étaient en possession.

C’est la dernière incursion des figures dans le monde du football. L’analyse des données permet déjà de tout gérer, des signatures et de l’intensité de l’entraînement aux tactiques à utiliser contre chaque adversaire, offrant même des recommandations sur la direction dans laquelle tirer à partir de chaque point du terrain.

Pendant ce temps, les footballeurs font face à un examen plus typique d’un astronaute. Les gilets et les bandes qu’ils portent peuvent détecter les mouvements, suivre leur position à l’aide du GPS et compter le nombre de coups qu’ils tirent avec chaque pied. Les caméras capturent tout sous plusieurs angles, comme la durée pendant laquelle les joueurs tiennent le ballon ou les balles aériennes gagnées. Et pour donner du sens à ces informations, la plupart des équipes d’élite emploient des analystes, dont des mathématiciens, des data scientists, et des physiciens de grandes entreprises et centres de recherche comme Microsoft ou le CERN, le laboratoire européen de physique des particules.

À leur tour, les idées de ces analystes changent la façon dont le jeu est joué : les attaquants ne tirent plus autant à distance, les ailiers passent à un coéquipier au lieu de centrer, et les entraîneurs sont obsédés par la récupération du ballon le plus près possible du but. .zone rivale. Tous ces changements tactiques sont étayés par des preuves solides qui soutiennent l’intuition de l’entraîneur.

« Le big data a ouvert une nouvelle ère dans le football », déclare Daniel Memmert, scientifique du sport au German Sports College. « Ils ont changé la philosophie et le comportement des équipes, la manière d’analyser les rivaux et la manière de développer les talents et de repérer les joueurs. »

L’un des exemples les plus célèbres de l’influence des données sur le sport provient d’un jeu différent. Dans son livre Moneyball , Michael Lewis explique comment Billy Beane, président de l’équipe de baseball d’Oakland Athletics, s’est appuyé sur des statistiques avancées pour constituer une équipe gagnante avec un budget minime en 2002. Beane a recruté des joueurs sur la base de données de performances détaillées, y compris des données auparavant sous-évaluées telles que la fréquence à laquelle un frappeur a atteint la base.

Beane avait un avantage sur ceux qui essaient de l’imiter dans le football. « Le football est beaucoup plus compliqué que le baseball », explique Memmert. Le baseball est un jeu avec des interruptions constantes et où, à tout moment, il n’y a qu’une seule équipe qui essaie de marquer des points. De plus, les statistiques de baseball étaient régulièrement recueillies et étudiées depuis des décennies. Au lieu de cela, le football est un jeu « d’invasion » fluide et à faible score (où le terrain est gagné et perdu tout le temps), et il est beaucoup plus difficile de savoir qui fait quoi et comment cela affecte le résultat. Pendant des décennies, les analystes du football se sont concentrés sur les buts marqués et encaissés, cherchant un moyen de les modéliser pour les prédictions.

Des variantes de cette méthode sont encore utilisées aujourd’hui pour prédire les résultats des matchs. Un modèle mathématique qui suppose que les buts marqués et encaissés sont répartis autour d’une valeur moyenne, développé par des épidémiologistes de l’Université d’Oxford, a correctement prédit que l’Italie battrait l’Angleterre lors de la finale de l’Euro 2020. Et il a également atteint six des huit quarts de finale.

Et ces bons résultats ne sont pas un feu de paille. Les prédictions statistiques de match sont plus précises que beaucoup ne le pensent, explique Matthew Penn, un étudiant au doctorat d’Oxford qui a développé le modèle Euro 2020. « Le but est d’attribuer à chaque équipe une note offensive et une note défensive, obtenues à partir du nombre total de buts que chacun équipe a marqué et la difficulté relative de ses rivaux », détaille-t-il. « En fin de compte, vous obtenez un excellent système d’équations pour trouver ces deux ensembles de scores, puis il est très facile de prédire n’importe quel résultat. » Pour la Coupe du monde au Qatar, le modèle de Penn suggère que la Belgique (qui ne figure pas parmi les grands favoris des bookmakers) est l’équipe la plus susceptible de remporter le trophée, suivie du Brésil.

Ce qui intéresse le plus les entraîneurs, ce sont les informations sur les événements du jeu et la manière dont les joueurs les influencent. Les analystes du football enregistrent ce type d’informations depuis longtemps. L’un des plus réussis était Charles Reep, un ancien comptable de la Royal Air Force britannique qui a passé une grande partie des années 1950 à regarder des matchs en Angleterre et à faire des observations de base sur des facteurs tels que les positions sur le terrain et les séquences de passes. Reep est allé jusqu’à utiliser ses données pour analyser les performances de l’équipe et suggérer des tactiques. Au club Wolverhampton Wanderers, il a contribué à établir un style de jeu direct et incisif qui évitait les passes latérales et avec lequel ils ont remporté trois championnats de la ligue en cinq ans.

Les techniques modernes rendent extrêmement facile la collecte et l’analyse de ces statistiques, ce qui a conduit presque tous les grands clubs et de nombreuses équipes nationales à s’appuyer sur des analystes de données pendant plus d’une décennie. Y esa tendencia se extiende a las categorías inferiores: aparte de realizar su doctorado, Penn trabaja como analista a tiempo parcial para el Oxford City, un equipo de fútbol semiprofesional que compite en la National League South, una de las ligas que conforman la sexta división d’Angleterre.

De nombreux analystes attribuent une partie du récent succès de Brentford (club londonien promu en première division anglaise il y a deux saisons pour la première fois en 74 ans) à un algorithme interne qui note les joueurs de différentes ligues et aide l’équipe à découvrir les talents cachés. . L’équipe de données de Liverpool, qui comprend des physiciens qui ont travaillé au CERN et à l’Université de Cambridge, a développé un modèle qui évalue si les actions d’un joueur sur le terrain augmentent les chances de marquer un but. Et les scientifiques du sport de l’Université de Lisbonne, en collaboration avec le Fútbol Club Barcelona, ​​ont publié l’année dernière une analyse des opportunités de passes tout au long d’un match, pour différents types de passes.

« Je pense que le plus utile de tout ce que nous faisons [à Oxford City], ce sont les briefings d’avant-match », a déclaré Penn. « Nous avons analysé les caractéristiques des joueurs de l’équipe adverse et créé des graphiques qui montrent comment ils jouent et se déplacent habituellement. Et puis je donne des conseils ou propose des changements tactiques.» Avant un récent match contre une équipe invaincue, l’analyse de Penn a révélé que l’arrière gauche avait de mauvaises statistiques de passes. « Donc, mon conseil était de mettre notre plus grand attaquant sur le côté droit du terrain », dit-il. Et Oxford a remporté le match. C’est le genre d’informations qu’un éclaireur expérimenté peut glaner à l’œil nu, mais selon Penn, « les données seront toujours moins faussées que l’opinion d’un spécialiste ».

Les équipes n’ont pas à générer elles-mêmes les données brutes pour une telle analyse tactique : elles peuvent acheter les données à des sociétés privées qui passent au crible la vidéo des matchs pour enregistrer le résultat de quelque 3 000 événements de jeu, tels que les dribbles, les passes et les tacles. Initialement, ces données étaient obtenues manuellement, mais il est maintenant courant d’utiliser la « vision par ordinateur », un type d’intelligence artificielle (IA). Souvent, les données sont accompagnées de statistiques descriptives, telles que le pourcentage de passes complétées par chaque joueur.

Joanna Marks, qui étudie un diplôme en mathématiques à l’Université de Warwick et travaille aux côtés de Penn à Oxford City, a développé plus tôt cette année un modèle qui utilisait ces données brutes pour évaluer l’efficacité des passes de tous les joueurs de la ligue d’Oxford. C’est le genre d’analyse détaillée qui n’est pas souvent disponible dans les données brutes fournies par les entreprises. «Il faut tenir compte du type de passe qu’ils tentent. Vous ne pouvez pas simplement regarder le pourcentage de passes réussies, car certaines sont beaucoup plus difficiles que d’autres », explique Marks. « Le modèle aide à préparer les matchs, car si vous trouvez que l’équipe adverse passe très bien d’une partie du terrain, alors vous savez à quoi vous attendre. »

Ravi Ramineni a travaillé comme analyste de données chez Microsoft jusqu’en 2012, date à laquelle il a accepté un poste similaire avec les Sounders de Seattle à Washington, son club local de la Ligue américaine de football. L’une de ses premières tâches a été d’utiliser les données GPS sur la distance parcourue par les joueurs pour optimiser leurs séances d’entraînement et de préparation. « En collectant ces données pendant l’entraînement, il est possible de savoir s’il a été trop intense ou trop doux, afin de prévenir les blessures. » Ça a marché? « Nous avons eu de très bonnes saisons lorsque nous avons appliqué ces méthodes. Mais je ne suis pas sur. La chose la plus difficile à quantifier est de savoir si une blessure a été évitée.

Cette incertitude pose problème lorsqu’il s’agit d’établir le rôle des données dans la réussite sportive : il n’existe pas d’expérience témoin pour tester l’efficacité. Pourtant, Ramineni note que les entraîneurs des Sounders ont été réceptifs à son analyse, à la fois à l’entraînement et pour juger des vertus des joueurs. « Ils m’ont donné une ligne directe avec les entraîneurs, et j’ai même pu aller parler aux joueurs en personne », apprécie-t-il. «Dans d’autres équipes, cela ne se produit pas. Parfois, le coach n’interagit même pas avec l’analyste de données. »

Les analystes accordent de plus en plus d’attention au jeu sans ballon. « Ce qu’on entend sans cesse dans l’analyse du football, c’est qu’on a besoin de savoir ce que fait le joueur quand il n’a pas le ballon », explique Ramineni.

C’est plus difficile et coûteux, car cela nécessite des caméras dédiées qui ne se contentent pas de suivre le jeu principal, mais gardent un œil sur les joueurs qui n’y sont pas directement impliqués, marquant leur emplacement environ 25 fois par seconde. Les entreprises qui fournissaient ce type de données avaient l’habitude de signer des contrats d’exclusivité avec les ligues nationales, révèle Ramineni, ce qui rendait difficile l’accès des autres professionnels. « Si vous recherchiez un joueur international d’Amérique du Sud ou d’Europe pour la ligue américaine, vous ne pouviez pas vérifier ses statistiques hors du ballon », dit-il.

Une technique plus puissante est apparue ces dernières années qui exploite l’IA pour prédire les mouvements des joueurs dans les matchs enregistrés, même lorsque les caméras ne sont pas sur eux. Cela signifie que les sociétés de données peuvent utiliser les séquences de matchs télévisés (disponibles sans restriction) pour effectuer une analyse complète des joueurs partout dans le monde, avec et sans ballon. L’un de ces modèles prédictifs est le fruit d’un accord entre des chercheurs de DeepMind (division IA de Google) et l’équipe de données de Liverpool. « Ce genre d’application nous permet de poser des questions tactiques ou des situations fictives », explique Ian Graham, le directeur de recherche de Liverpool, qui a quitté un post-doc en physique des polymères à l’université de Cambridge pour travailler sur les statistiques du football. «Pour un match spécifique, le modèle produit des milliers de simulations sur d’autres choses différentes qui auraient pu se produire. Ainsi, nous pouvons juger de l’efficacité d’un jeu d’attaque dans cette phase du match.

Les départements d’analyse des clubs ne partagent pas souvent des détails spécifiques sur ce qu’ils font ou sur la façon dont cela fonctionne, donc publier ce travail était gênant pour Liverpool, mais c’était une exigence pour travailler avec DeepMind. « Liverpool possède l’un des départements d’analyse les plus importants et les plus développés du monde du football, et nous n’avons nulle part les ressources nécessaires pour développer ces modèles nous-mêmes », admet Graham. Cela, au moins, vous donne une tranquillité d’esprit dont aucune autre équipe n’est capable.

Comme d’autres analystes de données, Graham hésite à s’attribuer le mérite des succès sportifs. « Le football est très variable, donc les équipes perdent souvent quand elles ne devraient pas perdre et gagnent quand elles ne devraient pas gagner », dit-il. « À bien des égards, notre travail est plus facile lorsque l’équipe va mal, car l’analyse montre généralement que nous avons bien joué. Et si nous continuons à jouer comme ça, nous finirons par gagner le nombre de matchs que nous attendions cette saison. »

Karl Tuyls, informaticien chez DeepMind, affirme que la modélisation en dehors du plan de la caméra est la première étape vers la création d’un assistant virtuel basé sur l’IA qui utilise des données en temps réel pour faciliter la prise de décision dans le football et d’autres sports. « Imaginez un système d’IA qui examine les performances de la première partie et suggère un changement tactique qui pourrait conduire à de meilleurs résultats », illustre-t-il. Cette approche pourrait également être utile dans d’autres domaines, par exemple pour modéliser les trajectoires des voitures sans conducteur et des piétons dans une rue animée de la ville, ajoute Tuyls.

Quelle est la prochaine étape? Comme tout scientifique, les experts qui analysent les données du football soulignent que davantage de recherches sont nécessaires. Sarah Rudd, une ancienne scientifique des données de Microsoft qui a quitté Arsenal l’année dernière après près d’une décennie à travailler comme analyste pour le club londonien, envie les grandes quantités de données de télémétrie produites par les voitures de course, qui permettent aux ingénieurs d’ajuster et d’améliorer leurs performances. « Nous regardons toujours la Formule 1 et disons que ce serait incroyable d’être à ce niveau », dit-il. « Dans le football, il y a encore beaucoup de choses qui ne se mesurent pas, et d’autres qui se mesurent mais nous n’avons pas trouvé comment en profiter. »

La prochaine avancée pourrait être de collecter des informations reflétant l’orientation spatiale des joueurs, voire leur façon de se pencher. « Les données que vous obtenez n’ont peut-être pas encore le niveau de détail que les gens recherchent », admet Rudd. « Ils n’obtiennent toujours pas cette petite feinte ou ce changement de poids qu’un joueur fait pour déséquilibrer le défenseur ou tromper le gardien de but. » Une connaissance incomplète de la position d’un joueur peut également être un problème, même pour les analyses basées sur l’IA de Liverpool. « Le modèle pourrait conclure qu’un joueur a fait une erreur parce qu’il aurait dû commencer à courir à un moment donné et ne l’a pas fait », explique Graham. « Mais c’est peut-être juste qu’il venait de trébucher et qu’il était allongé sur le sol. »

Quels changements dans le jeu ont provoqué cette avalanche de données que connaît le football moderne ? « Je dirais que le recrutement des joueurs est l’aspect où l’investissement rapporte le plus », valorise Ramineni. Bien qu’un autre domaine important soit celui des coups de pied arrêtés stratégiques, lorsqu’une équipe tire un coup franc après l’arrêt du jeu.

Une conclusion claire à tirer de l’analyse des données est que les attaquants ne doivent pas tirer de loin de la zone. « Si vous regardez n’importe quelle ligue dans le monde, la distance à partir de laquelle les joueurs tirent au but était beaucoup plus grande il y a dix ans », souligne Ramineni. « C’est arrivé parce que les analystes de données ont commencé à dire : ‘Pourquoi tirez-vous de là ? Il n’y a que 2 % de chances [de marquer] ! »‘ De nombreuses équipes demandent également à leurs joueurs de ne pas tenter de longs centres dans la surface, ajoute-t-il, après que les statistiques aient montré que la plupart n’étaient pas menaçants.

Previous articleDiscours de haine, feu de forêt
Next articleUn réseau de neurones sur le canapé