NVIDIA Isaac GR00T (Generalist Robot 00 Technology) ist eine Familie offener Basismodelle, die speziell für humanoide Roboter bestimmt sind. NVIDIA stellte sie im März 2024 vor und veröffentlichte die erste offene Version GR00T N1 im März 2025. Ziel ist es, den Herstellern ein „maßgeschneidertes Gehirn” zu geben, das sie nicht von Grund auf trainieren müssen — ähnlich wie große Sprachmodelle die Welle der Chatbots ausgelöst haben.
Wie GR00T funktioniert
GR00T ist ein VLA-Modell (Vision-Language-Action): am Eingang hat es ein Bild von den Kameras und eine Anweisung in natürlicher Sprache, am Ausgang Bewegungsbefehle für die Gelenke des Roboters. GR00T N1 verwendet eine zweikomponentige Architektur, inspiriert vom menschlichen Denken — ein langsames „überlegendes” System für die Planung und ein schnelles reaktives System, das fließende Bewegungen erzeugt (ein Aktionskopf, der auf einem Diffusionstransformer aufbaut).
Das Modell lernt aus drei Datenquellen zugleich: aus Internetvideos von Menschen, aus synthetischen Daten, die in der Simulation erzeugt werden (NVIDIA bietet dazu die Umgebung Isaac Sim und den Bewegungsgenerator GR00T-Dreams an), und aus realen Aufzeichnungen der Teleoperation. Diese Kombination löst das ewige Problem der Robotik — den Mangel an Trainingsdaten.
Warum das wichtig ist
GR00T ist Teil einer breiteren Strategie von NVIDIA, „während des Goldrauschs Schaufeln zu verkaufen” — statt eigene Roboter zu bauen, liefert NVIDIA Hardware (den Chip Jetson Thor), Simulationswerkzeuge und Modelle an alle Hersteller. Die Demo von GR00T N1 lief unter anderem auf dem Roboter Fourier GR-1 und auf Maschinen der Firma 1X.
Die Offenheit (sowohl das Modell als auch die Daten sind frei verfügbar) macht GR00T zu einem Referenzpunkt, an dem sich geschlossene Ansätze wie die von Tesla oder Figure messen, die ihre eigenen Weltmodelle intern aufbauen. Für kleinere Hersteller, die nicht die Kapazität haben, ein Basismodell selbst zu trainieren, ist es eine Abkürzung zu einsatzfähiger Intelligenz.