Modely světa (world model)

Vnitřní model, který předpovídá, jak se prostředí změní po akci robota — umožňuje „přemýšlet dopředu“ a plánovat bez zkoušení v realitě.

Model světa (world model) je vnitřní reprezentace, kterou si robot (nebo AI agent) drží o svém prostředí a o tom, jak na něj reagují jeho akce. Jednoduše řečeno: model světa umí předpovědět „když udělám tohle, stane se tamto”. Díky tomu může systém plánovat a zkoušet varianty mentálně — ve své „představivosti” — místo aby vše musel testovat draze a riskantně v realitě.

Koncept zpopularizoval výzkum okolo roku 2018 a v posledních letech zažívá renesanci díky generativní AI: model světa lze trénovat tak, aby z videa předpovídal budoucí snímky, čímž se učí intuitivní fyziku — jak padají předměty, jak se kape voda, co vydrží stát. Pro embodied AI je to považováno za jeden z chybějících dílků k opravdové obecné inteligenci.

Pro humanoidy mají modely světa hned dvojí užitek. Za prvé umožňují plánování dopředu — robot může „si promyslet” sekvenci pohybů a vybrat tu, která vede k cíli, podobně jako pokročilé varianty zpětnovazebního učení. Za druhé dobrý naučený model světa funguje jako rychlý simulátor a může pomoci se sim-to-real tím, že generuje realistická tréninková data.

NVIDIA kolem tohoto směru staví své „world foundation models” (rodina Cosmos) pro generování fyzikálně věrohodných scénářů. Mnoho výrobců humanoidů o modelech světa mluví jako o směřování, ale je férové dodat, že jde z velké části o aktivní výzkum, ne o hotovou nasazenou technologii. Hranice mezi marketingovým slovem „world model” a skutečně funkčním prediktivním modelem bývá v tiskových zprávách rozmazaná — proto vynecháváme konkrétní tvrzení tam, kde výrobce detaily nezveřejnil.

Modely světa (world model)

Související roboti

Související pojmy