En utilisant des robots ordinaires vendus dans le commerce et un modèle d’IA spécialisé, les chercheurs de DeepMind ont formé des robots footballeurs.
Auteur / Autrice :
On parlait récemment d’une étude qui mettait à mal une publication de chercheurs de Google DeepMind : les deux chimistes avaient étudié le détail des « 400 000 nouveaux matériaux créés avec une IA » et leurs conclusions n’étaient pas du tout positives.
Ce qui n’empêche pas les équipes de cette antenne du groupe Alphabet de continuer à faire progresser la recherche et de dévoiler régulièrement de nouveaux projets.
Dans une publication dévoilée le 10 avril dernier, une équipe présente comment ils ont formé des robots au football ! Il expliquent que « créer une intelligence générale incarnée », et mettre au point des agents capables d’agir dans le monde physique « avec agilité, dextérité et compréhension » est l’un des objectifs de longue date des chercheurs en intelligence artificielle (IA) et des roboticiens.
Les chercheurs font aussi un parallèle (cruel) entre les capacités des humains mais aussi des animaux, et celles des IA les plus avancées du monde et des robots actuels :
« Les animaux et les humains ne sont pas seulement maîtres de leur corps, capables d’effectuer et de combiner des mouvements complexes avec fluidité et sans effort, mais ils perçoivent et comprennent également leur environnement et utilisent leur corps pour obtenir des résultats complexes dans le monde. »
Cependant, les dernières avancées tant logiciels que matériels ont apporté des postes de progression important.
Côté logiciel, les budgets « IA » ont permis de développer Machine learning, Deep learning, et en particulier « deep reinforcement learning » (ou Deep RL) : C’est cet axe qui serait « capable de résoudre des problèmes complexes de contrôle moteur » des robots physiques et que l’équipe de DeepMind a approfondi pour ses robots footeux.

Un axe d’autant plus impressionnant que c’est en s’en servant que les chercheurs de DeepMind ont converti des robots « vendus dans le commerce à bas prix » en footballeurs : des modèles Robotis OP3 de Robotis, d’une hauteur de 51cm pour un poids de 3,5kg. Ils sont quand même commercialisés un peu plus de 10 000€.
Une fois formés, les robots ont joué sur un petit terrain sur-mesure de 5 m de long sur 4 m de large, et vous pouvez voir les résultats dans la vidéo ci-dessous :
Les chercheurs expliquent que cette expérience a donné des résultats qui vont « bien au-delà du niveau d’agilité et de maîtrise intuitivement attendu de ce type de robot ». Voici une liste des capacités de footballeurs développés par ces robots ordinaires une fois le modèle d’apprentissage développé par DeepMind appliqué :
- Des mouvement « agiles » comme se lever du sol ou se relever rapidement après une chute, courir et se retourner.
- Des interactions avec des objets, comme le contrôle du ballon puis le tir, mais aussi le tir dans un ballon en mouvement, et la capacité à faire des arrêts et bloquer des tirs.
- Des comportements stratégiques comme défendre en se plaçant systématiquement entre l’adversaire attaquant et son propre but et en protégeant le ballon avec son corps.
On notera quand même la faculté des robots à tomber beaucoup, souvent, tous seuls… Mais quand même, voir ces robots ordinaires capables de taquiner la gonfle comme vous et moi, et de mieux défendre que le commun des mortels peut impressionner quand on sait qu’ils ne sont pas du tout conçus pour ça !
Vous pouvez en découvrir bien plus sur l’expérience et les résultat dans la publication complète parue dans Science le 10 avril dernier : Retrouvez l’étude « Learning agile soccer skills for a bipedal robot with deep reinforcement learning » à ce lien.


