Embodied AI, česky vtělená inteligence, je myšlenka, že skutečně obecná inteligence nemůže vzniknout jen čtením textu a koukáním na obrázky — potřebuje tělo, kterým působí na svět, a smysly, kterými vnímá důsledky svých činů. Zatímco jazykový model se učí z internetu pasivně, vtělený agent (robot) se učí aktivně: zkusí něco udělat, vidí, co se stalo, a podle toho upravuje své chování. Tělo a prostředí jsou tu součástí učení, ne jen jeho výstupem.
Tato perspektiva má dlouhé kořeny v kognitivní vědě a robotice. Souvisí s Moravecovým paradoxem: zjistili jsme, že naučit AI logiku a šachy je snazší než dát jí dětskou obratnost a porozumění fyzickému světu — právě proto, že fyzické dovednosti se nedají jen „přečíst”, musí se ztělesnit.
Humanoidní roboti jsou často popisováni jako vlajková loď embodied AI — lidské tělo je univerzální nástroj pro svět navržený lidmi. Praktickým vyústěním je snaha postavit robotické foundation modely a VLA modely, které spojují obecné znalosti z internetu s fyzickou zkušeností. Klíčovou roli hrají i modely světa, díky nimž si agent může důsledky akcí předem představit.
Firmy jako Figure, Tesla nebo 1X staví svoji vizi výslovně na embodied AI — humanoid je pro ně „hardware pro inteligenci, která se učí ve fyzickém světě”. Je dobré rozlišovat hype od reality: pojem se používá i marketingově. Skutečný posun se měří tím, zda robot zvládá nové fyzické úkoly, na které ho nikdo přímo netrénoval — a v tom je obor zatím na začátku.