Pour prendre un virage sur la ligne la plus rapide sans perdre le contrôle, les pilotes de course doivent exécuter une séquence d’actions calculée avec précision: freiner, tourner le volant et accélérer. Le processus dépend des limites de frottement, qui sont régies par des lois physiques connues. Et les véhicules autonomes peuvent être programmés pour que, sur la base de ces lois, ils circulent le plus rapidement possible.
Cependant, les choses se compliquent lorsque le pilote automatique doit partager l’espace avec d’autres voitures. Une équipe de scientifiques a résolu le problème dans le monde virtuel, en formant un algorithme d’intelligence artificielle (IA) pour battre les concurrents humains dans Gran Turismo Sport ., un jeu de course d’un réalisme extraordinaire. Les résultats pourraient fournir des informations précieuses pour la conception de véhicules autonomes.
L’intelligence artificielle a déjà battu les joueurs humains dans certains jeux vidéo, comme Starcraft II et Dota 2 . Cependant, Gran Turismo Sport présente des différences importantes, note Peter Wurman, directeur de Sony AI (la division IA de Sony) en Amérique du Nord et co-auteur de la nouvelle étude, publiée dans Nature . « Dans la plupart des jeux, l’environnement définit les règles et protège chaque utilisateur du reste », explique-t-il. « Cependant, dans une course, les voitures sont très proches les unes des autres et il y a un protocole très élaboré qui doit être enseigné aux pilotes automatiques. Pour gagner, ils doivent respecter leurs adversaires, mais ils doivent aussi garder leur ligne et éviter les dépassements. »
Les chercheurs de Sony AI ont enseigné au programme les tenants et les aboutissants du jeu en utilisant une technique appelée apprentissage par renforcement profond. Les scientifiques ont « récompensé » l’algorithme pour certains comportements, comme ne pas quitter la piste, garder le contrôle du véhicule et respecter les règles de la compétition (éviter les chutes, par exemple). Ensuite, ils ont laissé le programme atteindre ces objectifs par lui-même. Ainsi, ils ont développé différentes versions de l’IA, appelées Gran Turismo Sophy (GT Sophy), afin que chacun apprenne à conduire une voiture spécifique sur un circuit spécifique. Les chercheurs ont ensuite mesuré les forces de certaines de ces versions contre des champions humains de Gran Turismo Sport .
Lors du premier test, qui a eu lieu en juillet dernier, les personnes ont obtenu le meilleur score global de l’équipe. Lors de la seconde, tenue en octobre 2021, les versions IA ont triomphé, réalisant les tours les plus rapides et battant leurs rivaux humains en équipe, en plus de remporter chacune des courses.
Les joueurs humains semblaient prendre la perte avec philosophie et aimaient même rivaliser avec l’IA. « Certains pilotes nous ont dit qu’ils avaient appris de nouvelles choses grâce aux manœuvres de Sophy », explique Erica Kato Marcus, directrice de la stratégie et de la collaboration chez Sony AI.
« Les lignes suivies par l’IA étaient très risquées. Je pourrais peut-être les prendre une fois, mais ils me semblaient tellement compliqués que jamais je ne m’y essaierais en course », confie Emily Jones, qui en 2020 a été finaliste mondiale du Gran Turismo Championship (compétition labellisée par la Fédération internationale de l’automobile ) et a couru plus tard contre GT Sophy. Bien que Jones admette qu’il se sentait quelque peu impuissant face à l’IA, il décrit l’expérience comme impressionnante. « En sport automobile, comme dans de nombreux autres sports, il s’agit de se rapprocher le plus possible du tour parfait, même si vous n’y arrivez jamais tout à fait », explique Jones. « Avec Sophy, ça me paraissait fou d’assister au tour parfait. Il était impossible d’aller plus vite.
L’équipe Sony continue d’affiner l’IA et aspire même à développer une version capable de rivaliser avec n’importe quelle voiture et sur n’importe quelle piste du jeu. Il espère également collaborer avec les créateurs de Gran Turismo Sport pour intégrer une version moins invincible de l’IA dans les futures mises à jour.
Étant donné que Gran Turismo Sport simule de manière réaliste des véhicules et des pistes du monde réel (ainsi que les paramètres physiques spécifiques qui les régissent), les recherches récentes pourraient être appliquées dans d’autres domaines, au-delà des jeux vidéo. « Un aspect intéressant qui le différencie du jeu Dota est que son environnement est basé sur la physique », explique Brooke Chan, ingénieur logiciel de la société OpenAI et co-auteur du projet OpenAI Five, qui a battu les humains dans Dota 2 . Lorsqu’une IA est formée pour concourir dans Gran Turismo Sport , elle apprend à mieux comprendre le monde physique, ajoute Chan, qui n’a pas participé à l’étude de GT Sophy.
» Gran Turismo Sport est un excellent simulateur : il est ludique à certains égards, mais il représente fidèlement bon nombre des différences qui existent entre les différentes voitures et circuits « , déclare J. Christian Gerdes, ingénieur en mécanique à l’université de Stanford qui n’a pas participé à la étude. « À mon avis, c’est ce qui se rapproche le plus de la publication d’un article prouvant qu’une IA est capable de rivaliser avec les humains dans un environnement automobile. »
Cependant, sur une route physique, la situation est très différente. « Dans le monde réel, vous devez faire face à des choses comme les cyclistes, les piétons, les animaux, les objets tombés des camions, le mauvais temps ou les pannes », explique Steven Shladover, un expert en automatisation des véhicules à l’Université de Californie à Berkeley qui n’a pas non plus t participer au studio. « Rien de tout cela n’apparaît dans les jeux. »
Étant donné que GT Sophy calcule la trajectoire la plus rapide sans négliger l’interaction avec des personnes souvent imprévisibles, ses réalisations pourraient être utiles dans d’autres domaines où les humains et les systèmes automatisés coopèrent, explique Gerdes. Au-delà de la conduite automatisée, cette capacité pourrait un jour faciliter les interactions qui ont lieu, par exemple, dans la chirurgie robotique ou avec des gadgets qui aident aux tâches ménagères.
Le succès de GT Sophy remet également en cause certaines hypothèses sur la façon dont les voitures autonomes sont programmées, ajoute Gerdes. Un grand nombre de véhicules automatisés perfectionnent leurs mouvements (comme tourner rapidement sans déraper) en suivant les lois de la physique intégrées à leur programmation, tandis que GT Sophy les optimise grâce à l’entraînement à l’IA.
« Je pense que l’essentiel pour les développeurs de véhicules autonomes est que certaines de nos idées préconçues doivent peut-être être revues, comme le fait que certains problèmes sont mieux résolus en appliquant la physique », conclut Gerdes. « L’intelligence artificielle pourrait également s’avérer utile à cet égard. »