Sim-to-real

Trenowanie robota w symulacji komputerowej i przeniesienie nauczonych umiejętności do rzeczywistej maszyny — tanio i bezpiecznie, lecz z luką między symulacją a rzeczywistością.

Sim-to-real (skrót od „from simulation to reality”) to metoda, w której robot najpierw uczy się danej umiejętności w symulacji komputerowej, a dopiero potem wyuczona polityka jest wgrywana do rzeczywistej maszyny. Główna motywacja jest praktyczna: w symulatorze fizyki można jednocześnie uruchomić tysiące wirtualnych robotów, które w ciągu kilku godzin zbierają doświadczenia odpowiadające latom treningu w rzeczywistości — i to bez ryzyka uszkodzenia drogiego sprzętu lub zranienia kogokolwiek.

Sim-to-real jest niemal niezbędny zwłaszcza przy chodzeniu i utrzymywaniu równowagi, gdzie szeroko stosuje się uczenie ze wzmocnieniem — w rzeczywistości wymaga ono ogromnej liczby upadków, na które nikt nie może sobie pozwolić. Wiele imponujących pokazów dynamicznego chodu i odzyskiwania równowagi przez roboty takie jak Unitree H1, Unitree G1 czy elektryczny Atlas powstało właśnie dzięki treningowi w symulacji.

Haczyk kryje się w pojęciu reality gap — luki między symulacją a rzeczywistością. Symulacja nigdy nie odwzorowuje idealnie tarcia, luzów w przekładniach, opóźnień sensorów ani drobnych odchyłek produkcyjnych, dlatego polityka, która sprawdzała się wirtualnie, może zawieść w rzeczywistości. Standardowym rozwiązaniem jest domain randomization: podczas treningu losowo zmienia się parametry środowiska (tarcie, masy, opóźnienia, szum sensorów), tak by polityka nauczyła się być odporna na niepewność i nie polegała na jednym precyzyjnym modelu świata.

Sim-to-real jest ściśle związany z cyfrowym bliźniakiem robota i środowiska oraz z wysokiej jakości silnikami fizyki. Dlatego NVIDIA buduje narzędzia symulacyjne i dane syntetyczne wokół swojego ekosystemu Isaac — symulacja staje się równie ważnym „źródłem danych” co rzeczywiste wdrożenie.

Powiązane roboty

Powiązane pojęcia