Resumen:

  • Boston Dynamics publicó “Air Spot | RL Behavior Research”, con saltos, giros y hasta backflips consecutivos.

  • Estas maniobras estresan motores y estructura para mejorar recuperación ante resbalones, golpes y cargas, con pipelines de RL desarrollados junto al RAI Institute.

  • Lo siguiente: más código y toolkits de RL abiertos para la comunidad y transferencia de estos avances a tareas industriales.

Spot volvió a acaparar miradas: en un clip reciente, el cuadrúpedo de Boston Dynamics encadena saltos y volteretas que culminan en varias backflips seguidas. El video, difundido a finales de agosto de 2025, muestra cómo el equipo entrena y verifica nuevas maniobras de “cuerpo completo” primero en simulación y luego en el robot, hasta que son fiables en hardware. La propia compañía acompañó el lanzamiento con un mensaje explícito: no se trata de un truco de circo, sino de forzar el sistema hasta el límite para aprender dónde y cómo falla.

El ángulo técnico es el aprendizaje por refuerzo (RL). Boston Dynamics y el Robotics & AI Institute (RAI) vienen colaborando en una cadena de entrenamiento que combina un modelo dinámico de Spot, un acceso de bajo nivel a motores y controladores, y transferencias “sim-to-real” iterativas. Esa colaboración ya dejó huella: además de los acrobacias, se documentó un aumento sustancial del rendimiento locomotor con políticas aprendidas y un Researcher Kit para RL que abre APIs de articulación y despliegue en el propio robot.

Entrenar volteretas sirve como “estrés controlado”: llevar los actuadores al tope permite capturar escenarios de borde (pérdida de tracción, impactos, aterrizajes imprecisos) y ajustar control y diseño para que, en la práctica, Spot sea más estable y se recupere más rápido cuando tropieza o transporta carga. La lectura utilitaria es directa: si el robot supera un backflip sin dañarse, tiene más margen para imprevistos menos dramáticos en una fábrica o en una planta energética. Varias coberturas independientes subrayan ese punto: el espectáculo documenta cómo aprende Spot a fallar mejor… y a levantarse mejor.

Bajo el capó, el RAI Institute publicó detalles de su método para reducir la brecha entre simulación y realidad. En su trabajo para ICRA 2025 describen cómo miden la “distancia” entre datos simulados y del robot con métricas distribucionales (Wasserstein y MMD) y usan ese score para ajustar parámetros de simulación que, a la larga, hacen que lo aprendido en virtual funcione en el mundo físico sin sorpresas. Es la parte menos vistosa del video, pero probablemente la más relevante para que un flip de laboratorio se traduzca en robustez operativa.

La hoja de ruta apunta a más apertura y portabilidad: Boston Dynamics ha ido liberando kits y guías para RL (incluido el RL Researcher Kit compatible con entornos como NVIDIA Isaac Lab) y documentación para que universidades y teams de I+D reproduzcan estos resultados en su propio hardware. Si sumamos el empuje reciente en humanoides (Atlas) y el foco del RAI en acelerar la producción de comportamientos con RL, el mensaje es claro: la acrobacia es demo, el destino es la resiliencia en tareas reales.

El video vende, sí, pero la ingeniería es el punto. Prefiero ver métricas duras (tiempos de recuperación, tasa de fallos, degradación térmica) y code reproducible que 10 backflips más; por ahora, el trabajo del RAI y los kits de Boston Dynamics van en la dirección correcta.

Fuentes:

Keep Reading

No posts found