L’IA incarnée (embodied AI) est l’idée selon laquelle une intelligence véritablement générale ne peut émerger de la seule lecture de texte et de l’observation d’images — elle a besoin d’un corps par lequel agir sur le monde, et de sens par lesquels percevoir les conséquences de ses actes. Tandis qu’un modèle de langage apprend passivement à partir d’internet, un agent incarné (un robot) apprend activement : il essaie de faire quelque chose, voit ce qui s’est passé, et ajuste son comportement en conséquence. Le corps et l’environnement font ici partie de l’apprentissage, et n’en sont pas seulement le produit.
Cette perspective a de profondes racines dans les sciences cognitives et la robotique. Elle est liée au paradoxe de Moravec : nous avons constaté qu’apprendre à une IA la logique et les échecs est plus facile que lui donner la dextérité d’un enfant et la compréhension du monde physique — précisément parce que les compétences physiques ne peuvent pas seulement se « lire », elles doivent s’incarner.
Les robots humanoïdes sont souvent décrits comme le navire amiral de l’IA incarnée — le corps humain est un outil universel pour un monde conçu par des humains. L’aboutissement pratique est l’effort de construire des modèles de fondation robotiques et des modèles VLA qui associent les connaissances générales d’internet à l’expérience physique. Les modèles du monde jouent aussi un rôle clé, grâce auxquels l’agent peut se représenter à l’avance les conséquences de ses actions.
Des entreprises comme Figure, Tesla ou 1X fondent explicitement leur vision sur l’IA incarnée — pour elles, l’humanoïde est « le matériel pour une intelligence qui apprend dans le monde physique ». Il est bon de distinguer le battage de la réalité : le terme est aussi employé à des fins marketing. Le véritable progrès se mesure à la capacité du robot à accomplir de nouvelles tâches physiques pour lesquelles personne ne l’a directement entraîné — et sur ce point, le domaine n’en est encore qu’à ses débuts.