← Retour à l’encyclopédie

Modèle du monde (world model)

Modèle interne qui prédit comment l’environnement changera après une action du robot — il permet de « réfléchir à l’avance » et de planifier sans essayer dans la réalité.

Le modèle du monde (world model) est une représentation interne qu’un robot (ou un agent d’IA) entretient au sujet de son environnement et de la manière dont ses actions y produisent des effets. En termes simples : le modèle du monde sait prédire « si je fais ceci, alors cela se produira ». Grâce à cela, le système peut planifier et essayer des variantes mentalement — dans son « imagination » — au lieu de devoir tout tester de façon coûteuse et risquée dans la réalité.

Le concept a été popularisé par des recherches autour de 2018 et connaît ces dernières années une renaissance grâce à l’IA générative : un modèle du monde peut être entraîné à prédire les images futures à partir d’une vidéo, ce par quoi il apprend une physique intuitive — comment tombent les objets, comment coule l’eau, ce qui tient debout. Pour l’IA incarnée, cela est considéré comme l’une des pièces manquantes vers une véritable intelligence générale.

Pour les humanoïdes, les modèles du monde ont une double utilité. Premièrement, ils permettent la planification anticipée — le robot peut « réfléchir » à une séquence de mouvements et choisir celle qui mène au but, à la manière des variantes avancées de l’apprentissage par renforcement. Deuxièmement, un bon modèle du monde appris fonctionne comme un simulateur rapide et peut aider au sim-to-real en générant des données d’entraînement réalistes.

NVIDIA construit autour de cette orientation ses « world foundation models » (la famille Cosmos) pour générer des scénarios physiquement plausibles. De nombreux fabricants d’humanoïdes parlent des modèles du monde comme d’un cap à suivre, mais il est juste d’ajouter qu’il s’agit en grande partie de recherche active, et non d’une technologie déployée et achevée. La frontière entre le mot marketing « world model » et un modèle prédictif réellement fonctionnel est souvent floue dans les communiqués de presse — c’est pourquoi nous omettons les affirmations précises là où le fabricant n’a pas publié les détails.

Robots liés

Termes liés