Puede que los robots humanoides sean capaces de correr, bailar y, de vez en cuando, dar una patada a alguien, pero para llegar a ser verdaderamente “humanos” tendrán que aprender a realizar todo tipo de tareas sencillas en el trabajo.
Robots que aprenden observando
Flexion Robotics, una startup suiza fundada por antiguos investigadores en robótica de Nvidia, cree tener la solución. La empresa ha desarrollado un método para entrenar a los robots a realizar tareas complejas que implican habilidades sencillas, como abrir puertas, subir escaleras y transportar cajas. La clave está en enseñar a los robots habilidades individuales mediante simulación y, a continuación, dejar que un algoritmo de IA maestro determine cómo utilizarlas.
La mayoría de los videos de demostración muestran humanoides que han sido entrenados para realizar una tarea específica, como doblar camisetas o reponer estanterías. Normalmente, esto se hace mediante teleoperación: una persona entre bastidores que controla los movimientos del robot. Pero este enfoque no funciona de forma fiable cuando el robot se encuentra en entornos desconocidos. Flexion asegura que su sistema es diferente, y más eficiente, porque entrena a sus robots mediante simulación y con una intervención humana mínima.
El siguiente video muestra el software en acción: un robot humanoide Unitree modificado opera de forma autónoma tras recibir la siguiente orden: “Se ha entregado un paquete con aperitivos para Flexion. Recógelo por las escaleras y sube en el ascensor. A continuación, ábrelo y coloca los artículos en el cajón vacío de la estantería de la zona de aperitivos”.
Cortesía de Flexion
El enfoque se basa en la combinación de diferentes sistemas de IA
El modelo principal de IA aprende a realizar sus tareas analizando videos de personas realizando diferentes acciones. Estos videos le enseñan al modelo qué acciones debe llevar a cabo y cuándo, pero no cómo ejecutarlas físicamente. A continuación, el software activa las habilidades aprendidas (que ha adquirido en la simulación) y realiza esas tareas en el mundo real. Por ejemplo, para llegar a la sala de correo de una oficina, el modelo puede haber aprendido que tiene que abrir determinadas puertas y utilizar el ascensor. El sistema también controla los motores del robot, lo que le permite caminar, mover sus extremidades y mantener el equilibrio.
Según Nikita Rudin, cofundador y director ejecutivo de Flexion y antiguo investigador en robótica de Nvidia, el “ingrediente secreto” del software es su uso extensivo del aprendizaje por refuerzo, que entrena a las computadoras para dominar tareas mediante ensayo y error. Cada capa del software usa este enfoque, desde el modelo principal de IA hasta la simulación y el control de los motores,.


