Robot Learning

Train robot policies in simulation for real-world adaptability.

Boston Dynamics

Workloads

Accelerated Computing Tools & Techniques
Data Center / Cloud
Robotics
Simulation / Modeling / Design

Industries

Healthcare and Life Sciences
Manufacturing
Retail/ Consumer Packaged Goods
Smart Cities/Spaces

Business Goal

Innovation
Return on Investment

Products

NVIDIA Isaac GR00T
NVIDIA Isaac Lab
NVIDIA Isaac Sim
NVIDIA Jetson AGX
NVIDIA Omniverse

Build Generalist Robot Policies

Los robots preprogramados operan con instrucciones fijas dentro de entornos establecidos, lo que limita su adaptabilidad a cambios inesperados.

Los robots impulsados por IA abordan estas limitaciones a través del aprendizaje basado en simulación, lo que les permite percibir, planificar y actuar de forma autónoma en condiciones dinámicas. Con el aprendizaje de robots, pueden adquirir y refinar nuevas habilidades mediante el uso de políticas aprendidas (conjuntos de comportamientos para navegación, manipulación y más) a efectos de mejorar su toma de decisiones en varias situaciones.

Beneficios del Aprendizaje de Robots Basado en Simulación

Flexibilidad y Escalabilidad

Itere, refine e implemente políticas de robots para escenarios del mundo real mediante una variedad de fuentes de datos a partir de los datos reales capturados por sus robots y datos sintéticos en simulación. Esto funciona con cualquier tipo de robot, como robots móviles autónomos (AMR), brazos robóticos y robots humanoides. El enfoque basado en “primero simulación” también le permite entrenar rápidamente cientos o miles de instancias de robots en paralelo.  

Desarrollo Acelerado de Habilidades

Entrene robots en entornos simulados para adaptarse a nuevas variaciones de tareas sin la necesidad de reprogramar el hardware del robot físico. 

Entornos Físicamente Precisos

Modele fácilmente factores físicos, como interacciones de objetos (rígidos o deformables), fricción, etc., para que reduzca significativamente la brecha entre la simulación y la realidad.  

Entorno de Pruebas Seguro

Pruebe escenarios potencialmente peligrosos de forma segura, sin presentar riesgos de seguridad para los humanos o de daños en los equipos.

Costos Reducidos

Evite la carga de la recopilación de datos y de los costos de etiquetado del mundo real al generar grandes cantidades de datos sintéticos, validar políticas de robots entrenados en simulación e implementar robots más rápido. 

Algoritmos de Aprendizaje de Robots

Los algoritmos de aprendizaje de robots, como el aprendizaje por imitación o el aprendizaje por refuerzo, pueden ayudarles a los robots a generalizar las habilidades aprendidas y a mejorar su desempeño en entornos cambiantes o novedosos. Hay varias técnicas de aprendizaje, que incluyen:

  • Aprendizaje por Refuerzo: Es un enfoque de prueba y error en el que el robot recibe una recompensa o una penalización en función de las acciones que realiza. 
  • Aprendizaje por Imitación: El robot puede aprender a partir de demostraciones humanas de tareas. 
  • Aprendizaje Supervisado: Se puede entrenar al robot con datos etiquetados para que aprenda tareas específicas.
  • Política de Difusión: El robot usa modelos generativos para crear y optimizar sus acciones a fin de obtener los resultados deseados.
  • Aprendizaje Autosupervisado: Cuando hay conjuntos de datos etiquetados limitados, los robots pueden generar sus propias etiquetas de entrenamiento a partir de datos sin etiquetar, con el fin de extraer información significativa.

Teach Robots to Learn and Adapt

A typical end-to-end robot workflow involves data processing, model training, validation in simulation, and deployment on a real robot.

Procesamiento de Datos: Para cerrar las brechas de datos, puede considerar un conjunto diverso de fuentes de datos de alta calidad mediante la combinación de datos a escala de Internet, datos sintéticos y datos de robots en vivo. 

Entrenamiento y Validación en Simulación: Los robots deben ser entrenados e implementados para escenarios definidos por tareas y requieren representaciones virtuales precisas de condiciones del mundo real. El framework de código abierto NVIDIA Isaac™ Lab puede ayudar a entrenar políticas de robots mediante técnicas de aprendizaje por refuerzo y aprendizaje por imitación en un enfoque modular. Isaac Lab también se puede usar con las plataformas de simulación para desarrolladores NVIDIA Isaac Sim™ o MuJoCo para crear prototipos rápidamente y para implementar políticas de robots.

Una vez que el robot ha sido entrenado, su desempeño se puede validar en Isaac Sim, una aplicación de simulación robótica de referencia basada en NVIDIA Omniverse™.

Implementación en el Robot Real: Las políticas de robots entrenados y los modelos de IA se pueden implementar en computadoras NVIDIA Jetson™ montadas en robots, las cuales ofrecen el desempeño y la seguridad funcional necesarios para una operación autónoma.

Imitation Learning and Reinforcement Learning for Robots

Imitation Learning

While imitation learning lets humanoid robots develop new skills by replicating expert demonstrations, collecting real-world datasets is often expensive and labor-intensive. 

To overcome this challenge, developers can use the NVIDIA Isaac GR00T-Mimic and GR00T-Dreams blueprints—built on NVIDIA Cosmos™—to produce large, diverse synthetic motion datasets for training. 

These datasets can then be used to train the Isaac GR00T N open foundation models within Isaac Lab, enabling generalized humanoid reasoning and robust skill acquisition.

Reinforcement Learning

Use Isaac Lab to conduct high-fidelity physics simulations, perform reward calculations, and enable perception-driven reinforcement learning (RL) within modular, customizable environments.

Start by configuring a wide variety of robots in varying environments, defining RL tasks, and training models using GPU-optimized libraries such as RSL RL, RL-Games, SKRL, and Stable Baselines3—all supported natively by Isaac Lab.

Isaac Lab offers flexible task workflows—either direct or manager-based—so you have control over the complexity and automation of your training jobs. Additionally, NVIDIA OSMO—a cloud-native orchestration platform—enables efficient scaling and management of complex, multi-stage, and multi-container robotics workloads across multi-GPU and multi-node systems. This can significantly accelerate the development and evaluation of robot learning policies.

Get Started

Build adaptable robots with robust, perception-enabled, simulation-trained policies using NVIDIA Isaac Lab open-source modular framework for robot learning.

Servidor RTX PRO: la Mejor Plataforma para IA Industrial y Física

El servidor NVIDIA RTX PRO acelera todas las cargas de trabajo de digitalización industrial, simulación de robots y generación de datos sintéticos.

News

Related Use Cases