NVIDIA Isaac GR00T (Generalist Robot 00 Technology) to rodzina otwartych modeli podstawowych przeznaczonych specjalnie dla robotów humanoidalnych. NVIDIA zaprezentowała ją w marcu 2024 roku, a pierwszą otwartą wersję — GR00T N1 — udostępniła w marcu 2025 roku. Celem jest dostarczenie producentom gotowego „mózgu”, który nie wymaga trenowania od podstaw — podobnie jak duże modele językowe zapoczątkowały falę chatbotów.
Jak działa GR00T
GR00T jest modelem VLA (vision-language-action): na wejściu otrzymuje obraz z kamer i polecenie w języku naturalnym, a na wyjściu generuje rozkazy ruchu dla stawów robota. GR00T N1 wykorzystuje dwuskładnikową architekturę inspirowaną ludzkim myśleniem — wolny „rozumujący” system do planowania oraz szybki system reaktywny, który generuje płynne ruchy (głowica akcji oparta na dyfuzyjnym transformerze).
Model uczy się jednocześnie z trzech źródeł danych: z internetowych filmów z ludźmi, z danych syntetycznych wytworzonych w symulacji (NVIDIA oferuje do tego środowisko Isaac Sim i generator ruchów GR00T-Dreams) oraz z rzeczywistych nagrań teleoperacji. To połączenie rozwiązuje odwieczny problem robotyki — brak danych treningowych.
Dlaczego to ma znaczenie
GR00T wpisuje się w szerszą strategię NVIDIA polegającą na „sprzedawaniu łopat podczas gorączki złota” — zamiast budować własne roboty, NVIDIA dostarcza sprzęt (układ Jetson Thor), narzędzia symulacyjne i modele wszystkim producentom. Demo GR00T N1 działało między innymi na robocie Fourier GR-1 oraz na maszynach firmy 1X.
Otwartość (model i dane są publicznie dostępne) sprawia, że GR00T staje się punktem odniesienia, do którego porównują się zamknięte podejścia firm takich jak Tesla czy Figure, które własne modele świata budują wewnętrznie. Dla mniejszych producentów nieposiadających zasobów do trenowania modeli podstawowych jest to skrót do użytecznej inteligencji.