un modèle d’IA transforme des commandes textuelles en mouvements pour divers robots et avatars

Publié le 9 mai 2025 à 09h04
modifié le 9 mai 2025 à 09h04
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

L’incursion de l’intelligence artificielle dans le domaine de la robotique marque une révolution. Un modèle d’IA innovant, MotionGlot, transforme les commandes textuelles en mouvements dynamiques, s’adaptant à divers robots et avatars. Ce progrès technologique libère l’expression des idées en facilitant la communication entre l’homme et la machine.

*La traduction de données textuelles en actions précises* offre des perspectives inédits dans l’interaction homme-robot. Une diversité d’applications devient alors envisageable grâce à cette méthode. *L’adaptabilité de MotionGlot* bouleverse ainsi les champs du jeu vidéo, de la réalité virtuelle et de l’animation numérique.

Le passage de l’instruction linguistique à la mise en œuvre corporelle constitue une avancée majeure. En prenant en compte la morphologie variée des entités animées, cette technologie pave le chemin à une collaboration humaine enrichie.

Un modèle d’IA innovant pour la génération de mouvements

Des chercheurs de l’Université Brown ont élaboré un modèle d’intelligence artificielle nommé MotionGlot. Ce modèle génère des trajectoires de mouvement en fonction de commandes textuelles, permettant d’animer à la fois des robots quadrupèdes et des avatars humains. Cette avancée marque une étape significative dans le domaine de l’IA, faisant écho aux réalisations des modèles tels que ChatGPT, qui génèrent du texte à partir d’instructions utilisateur.

Fonctionnement du modèle MotionGlot

Les utilisateurs peuvent simplement formuler des instructions telles que « marcher quelques pas en avant et tourner à droite ». En réponse, le modèle traduit ces commandes en mouvements appropriés pour différents types d’incarnations, allant des robots humanoïdes aux animaux. Cette capacité à traduire des mouvements d’une forme à une autre élargit considérablement les applications potentielles de l’IA dans divers contextes.

Processus de traduction de mouvements

Les progrès réalisés par MotionGlot reposent sur l’idée de considérer le mouvement comme une langue. Selon Sudarshan Harithas, doctorant en informatique à Brown et leader du projet, cela permet une interprétation des commandes verbales, traduisant leur signification en actions physiques. En s’appuyant sur des modèles de langage préexistants, MotionGlot peut modéliser des actions en décomposant les mouvements en unités comparables aux mots dans un texte.

Cette approche mène à une modélisation fine des positions corporelles. Par exemple, le processus de marche d’un humain et celui d’un chien sont fondamentalement différents, mais MotionGlot parvient à les traduire efficacement d’un contexte à l’autre.

Apprentissage et performance du modèle

Le modèle a été formé à partir de deux jeux de données richement annotés, chacun contenant des heures de données de mouvement. Le premier, nommé QUAD-LOCO, comprend des vidéos de robots quadrupèdes exécutant diverses actions, accompagnées de descriptions détaillées. Le second, QUES-CAP, capture des mouvements humains réels, également enrichis de légendes et d’annotations pertinentes.

La capacité de MotionGlot à générer des actions précises à partir d’instructions textuelles, même si celles-ci n’ont jamais été rencontrées auparavant, témoigne de sa robustesse. Lors des tests, il fut capable d’interpréter des directives telles que « un robot marche à reculons, tourne à gauche puis avance » avec un étonnant taux de succès.

Applications potentielles et développement futurs

Les implications de cette technologie sont vastes. MotionGlot peut être appliqué dans des domaines variés, notamment la collaboration homme-robot, les jeux vidéo, la réalité virtuelle, ainsi que l’animation numérique et la production vidéo. Les chercheurs prévoient également de rendre le modèle et son code source accessibles au public, favorisant les recherches ultérieures et le développement de nouvelles applications.

Les résultats de cette recherche seront présentés prochainement lors de la Conférence internationale sur la robotique et l’automatisation de 2025 à Atlanta, illustrant ainsi l’engagement de l’équipe envers l’innovation continue dans ce domaine dynamique.

Pour davantage de contextes autour des avancées technologiques liées à l’IA, vous pourriez consulter des articles comme Le programme MIT-Portugal, ou encore un partenaire de création musicale alimenté par l’IA.

Enfin, la capacité de MotionGlot à répondre émotionnellement à des questions, comme en montrant une personne en train de courir lorsqu’on lui réclame une démonstration d’activité cardio, ouvre des perspectives fascinantes pour l’interaction humaine avec les machines.

Foire aux questions courantes

Qu’est-ce que le modèle MotionGlot ?
MotionGlot est un modèle d’intelligence artificielle capable de générer des trajectoires de mouvement à partir de commandes textuelles, s’adaptant à différents types de robots et d’avatars animés.

Comment fonctionne MotionGlot pour traduire des instructions textuelles en mouvements ?
Le modèle décompose les instructions en unités appelées « tokens », qui représentent des éléments de mouvement. Ensuite, il génère des mouvements appropriés en prédisant les actions suivantes basées sur ces tokens.

Quels types d’entités MotionGlot peut-il animer ?
MotionGlot peut animer une variété d’entités allant des robots quadrupèdes aux figures humanoïdes, permettant ainsi une large gamme d’applications robotiques.

Quelle est la principale innovation introduite par MotionGlot ?
La principale avancée de MotionGlot réside dans sa capacité à traduire des commandes de mouvement entre différents types d’entités, rendant la technologie applicable à diverses configurations spatiales.

Quelles données ont été utilisées pour entraîner le modèle MotionGlot ?
Le modèle a été formé sur deux ensembles de données, QUAD-LOCO pour les robots quadrupèdes et QUES-CAP pour les mouvements humains, comprenant des heures de données de mouvement annotées.

Comment MotionGlot gère-t-il les différences de mouvement entre les entités ?
MotionGlot est conçu pour comprendre et adapter le sens des mouvements comme « marcher » afin de produire des sorties de mouvement correctes, quelle que soit l’entité commandée, qu’il s’agisse d’un humanoïde ou d’un chien robot.

Quels types d’applications pourraient bénéficier de MotionGlot ?
Les applications potentielles incluent la collaboration homme-robot, le jeu vidéo, la réalité virtuelle, ainsi que la production d’animations numériques et vidéo.

Est-il possible d’utiliser MotionGlot pour des mouvements qu’il n’a jamais vus auparavant ?
Oui, le modèle peut générer des mouvements appropriés même pour des instructions qu’il n’a pas spécifiquement rencontrées lors de son entraînement.

Où puis-je trouver le code source de MotionGlot ?
Les chercheurs prévoient de rendre le modèle et son code source disponibles au public, permettant ainsi à d’autres chercheurs de l’utiliser et de l’étendre.

Quelles sont les implications futures de la technologie MotionGlot ?
Cette technologie ouvre de nouvelles perspectives pour les interactions homme-machine, notamment dans les domaines de l’éducation, de l’entraînement et de la simulation d’activités physiques.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsun modèle d'IA transforme des commandes textuelles en mouvements pour divers robots...

microsoft affirme que son nouvel outil d’intelligence artificielle en santé surpasse de loin les médecins dans la précision des...

découvrez comment microsoft révolutionne le secteur de la santé avec un nouvel outil d'intelligence artificielle capable de surpasser les médecins en précision de diagnostic. un aperçu des avancées technologiques qui transforment les soins médicaux.

Une expérience inattendue : l’IA à la tête d’un magasin pendant un mois

découvrez comment une intelligence artificielle prend les rênes d'un magasin pendant un mois, offrant une expérience client inédite et révélant les défis et succès d'une gestion automatisée. plongez dans cette aventure captivante où technologie et commerce se rencontrent de manière surprenante.
découvrez comment meta attire les talents d'openai, intensifiant ainsi la compétition pour l'innovation en intelligence artificielle. une course passionnante vers l'avenir de la tech où les esprits brillants se rencontrent pour repousser les limites de l'ia.
découvrez l'initiative 'osez l'ia' du gouvernement français, visant à réduire le fossé en intelligence artificielle. cette stratégie ambitieuse vise à encourager l'innovation, à soutenir la recherche et à renforcer la position de la france sur la scène mondiale de l'ia.

L’ascension de la Chatbot Arena : le nouveau guide incontournable de l’IA

découvrez comment la chatbot arena révolutionne le monde de l'intelligence artificielle. ce guide incontournable vous plonge dans l'univers des chatbots, leurs applications, et leurs impacts sur notre quotidien. ne manquez pas cette ressource essentielle pour comprendre l'avenir de la communication automatisée.
découvrez comment une étude récente du mit montre que l'utilisation de chatgpt entraîne une réduction significative de l'activité cérébrale. plongez dans les implications de cette recherche sur notre interaction avec les intelligences artificielles et les conséquences sur notre cognition.