En créant une base de connaissance robotique open source, Google Deepmind veut développer un référentiel commun, et les premiers résultats montrent que les robots sont meilleurs lorsque leur corpus est plus large.
Auteur / Autrice :
Google Deepmind annonce la base de connaissance robotique Open X-Embodiment
Depuis une cinquantaine d’années, la robotique fait de grands progrès, à mesure que la technologie elle-même progresse. De meilleurs logiciels, de meilleurs matériaux, de meilleurs processeurs permettent de meilleurs robots.
Mais les robots les plus perfectionnés sont souvent les plus spécialisés : ils sont conçus pour réaliser un spectre de tâches très précises (voire une seule), et ne sont absolument pas pensés ou prévus pour être polyvalents, ou adaptables.
Mais comment passer de la robotique à usage unique à une robotique à usage général ? En permettant un apprentissage simplifié, via la création d’une base commune de connaissances et d’apprentissage.
Un projet qui prend forme, avec l’annonce faite cette semaine par Google Deepmind de la création de la base de données Open X-Embodiment. Pour cela, Google Deepmind s’est associé avec 33 laboratoires de recherche, issus d’une vingtaine d’institutions différentes.
Ensemble, ils ont regroupé les connaissances de 22 types de robots différents. Ce qui correspondrait à plus de 500 compétences générales, permettant d’accomplir environ 150 000 tâches. Pour Google, “cet ensemble de données est le plus complet de son genre.”

Des connaissances plus diversifiées font des robots plus performants
Google Deepmind accompagne l’annonce de la création de la base Open X-Embodiment avec la publication de RT-1-X, un modèle de transformateur robotique (RT) dérivé de RT-1 et formé sur la nouvelle base de données.
D’après les premiers essais, RT-1-X montre “que la formation d’un modèle unique sur les données de plusieurs modes de réalisation conduit à des performances nettement meilleures sur de nombreux robots que celles formées sur les données de modes de réalisation individuels“. En fait, RT-1-X (formé avec l’ensemble de données Open X-Embodiment) a surpassé le modèle d’origine de 50 % en moyenne.
Les chercheurs présentent aussi les résultats de RT-2-X, un modèle vision-langage-action (VLA), formé d’après RT-2, qui apprend des données du web et de la base robotique ; Toujours pour étudier le transfert de connaissances entre robots.
Ils ont fait des expériences avec leur robot, impliquant des tâches autour d’objets et de compétences qui ne sont pas présents dans RT-2, mais existent dans une autre base de données d’un autre robot. Et RT-2-X a connu trois fois plus de succès que RT-2 pour des compétences qu’il ne possédait pas au préalable.


Google Deepmind et les laboratoires associés proposent leurs connaissances en open source
L’ensemble de ces ressources est proposé en open source : d’où le Open présent dans le nom de la base Open X-Embodiment (Quelqu’un a dit “OpenAI” ?) :
“L’ensemble de données Open X-Embodiment et le modèle RT-1-X sont désormais disponibles pour le bénéfice de la communauté de recherche au sens large, grâce au travail des laboratoires de robotique du monde entier qui ont partagé des données et aidé à évaluer notre modèle dans un engagement ouvert et développer cette technologie de manière responsable. Nous pensons que ces outils transformeront la façon dont les robots sont formés et accéléreront ce domaine de recherche.”
L’article cite d’ailleurs l’exemple de ImageNet, une base de données d’images créée en 2009, qui compte aujourd’hui 14 197 122 images, et qui a propulsé la recherche sur la vision par ordinateur : “Nous pensons qu’Open X-Embodiment peut faire de même pour faire progresser la robotique”.
Enfin, une ouverture plus large sur l’avenir de la robotique promeut invariablement la collaboration et le partage dans une optique de progression et d’amélioration, mais aussi de sécurité :
“Travailler en collaboration avec des laboratoires du monde entier et partager des ressources est essentiel pour faire progresser la recherche en robotique de manière ouverte et responsable. Nous espérons que l’ouverture des données et la fourniture de modèles sûrs mais limités réduiront les obstacles et accéléreront la recherche. L’avenir de la robotique repose sur la capacité des robots à apprendre les uns des autres et, surtout, sur la capacité des chercheurs à apprendre les uns des autres. “