El volante de datos (data flywheel) es un bucle comercial y técnico que se refuerza a sí mismo. El principio: cuantos más robots se despliegan, más datos reales sobre las tareas recogen; con esos datos se entrena un modelo mejor; un modelo mejor hace a los robots más capaces y fiables; los robots más capaces se despliegan y se venden más; y un mayor despliegue genera todavía más datos. Una vez que la rueda empieza a girar, va acumulando inercia por sí sola y a la competencia le cuesta mucho alcanzarla; por eso se le llama «volante».
En robótica este concepto es especialmente importante, porque el principal freno del progreso es la escasez de datos. Los datos robóticos son varios órdenes de magnitud menos abundantes que el texto o el vídeo en internet y, además, son difíciles de recoger: cada ejemplo requiere ejecutar físicamente la tarea, a menudo mediante teleoperación. Quien logre recoger de forma barata y a gran escala datos de calidad procedentes de despliegues reales obtiene la materia prima para el aprendizaje por imitación y para construir modelos fundacionales más potentes.
Precisamente por eso muchos fabricantes se apresuran a desplegar robots en pilotos reales aunque aún no sean perfectos: el objetivo es hacer girar el volante antes que la competencia. Tesla aprovecha su experiencia en la recogida de datos de flota de coches, Figure y 1X construyen sus estrategias en torno al creciente número de unidades desplegadas, y Digit recoge datos de almacenes reales.
El volante es a la vez una consigna muy usada en las presentaciones a inversores, así que conviene mantener la sobriedad. La verdadera ventaja no surge de la cantidad de datos en bruto, sino de datos de calidad, variados y bien etiquetados, y de si la empresa realmente sabe cerrar el bucle y no solo dibujarlo en una diapositiva.