Sim-to-real

Trénink robota v počítačové simulaci a následný přenos naučených dovedností do reálného stroje — levně a bezpečně, ale s mezerou mezi simulací a realitou.

Sim-to-real (zkratka pro „from simulation to reality”) je postup, kdy se robot nejdřív naučí dovednost v počítačové simulaci a teprve potom se naučená politika nahraje do reálného stroje. Hlavní motivace je praktická: ve fyzice běžící v simulátoru lze paralelně rozběhnout tisíce virtuálních robotů, kteří během několika hodin nasbírají zkušenost odpovídající letům reálného tréninku — a to bez rizika, že se drahý hardware rozbije nebo někoho zraní.

Sim-to-real je téměř nepostradatelný hlavně pro chůzi a rovnováhu, kde se masivně uplatňuje zpětnovazební učení — to v realitě vyžaduje obrovské množství pádů, které si nikdo nemůže dovolit. Mnoho působivých ukázek dynamické chůze a obnovy rovnováhy u robotů jako Unitree H1, Unitree G1 nebo elektrický Atlas vzniklo právě tréninkem v simulaci.

Háček se jmenuje reality gap — mezera mezi simulací a realitou. Simulace nikdy dokonale netrefí tření, vůle v převodovkách, latence senzorů ani drobné odchylky výroby, takže politika, která fungovala virtuálně, může v realitě selhat. Standardním řešením je domain randomization: během tréninku se náhodně mění parametry prostředí (tření, hmotnosti, zpoždění, šum senzorů), takže se politika naučí být robustní vůči nejistotě a nespoléhá na jeden přesný model světa.

Sim-to-real úzce souvisí s digitálním dvojčetem robota i prostředí a s kvalitními fyzikálními enginy. NVIDIA proto kolem svého ekosystému Isaac staví simulační nástroje a syntetická data — simulace se tak stává stejně důležitým „zdrojem dat” jako reálné nasazení.

Související roboti

Související pojmy