Así es el primer robot pizzero, creado por el MIT: es capaz de trabajar y dar forma a materiales blandos

Manos moldeando una masa para hacer pizza.

Cada vez es más difícil que alguien se sorprenda cuando a un robot se le atribuyen habilidades humanas. Tanto las cualidades motoras como físicas cada vez son más frecuentes en las máquinas. De hecho, recientemente pudimos ver al primer robot humanoide jubilarse

Sin embargo, a pesar de los avances, hasta ahora no había sido posible ver a un robot trabajando con objetos moldeables. 

Recientemente, el MIT ha creado el primer robot pizzero capaz de trabajar con un objeto deformable como la masa. La complejidad del asunto se encuentra en la mutabilidad de la forma, lo cual es difícil representar con una ecuación comprensible para el robot. 

Además, crear una nueva forma a partir de esa masa requiere múltiples pasos y el uso de diferentes herramientas. Para un robot es especialmente difícil aprender una tarea de manipulación con una larga secuencia de pasos, ya que el aprendizaje suele producirse por ensayo y error.

Investigadores del MIT, la Universidad Carnegie Mellon y la Universidad de California en San Diego han ideado una forma mejor. Han creado un marco para un sistema de manipulación robótica que utiliza un proceso de aprendizaje en dos fases, lo que podría permitir a un robot realizar complejas tareas de manipulación de la masa durante un largo periodo de tiempo. 

Primero, un algoritmo "maestro" resuelve cada paso que debe dar el robot para completar la tarea. A continuación, entrena a un modelo de aprendizaje automático "alumno" que consolida ideas abstractas sobre cuándo y cómo ejecutar cada habilidad que necesita, como el uso de un rodillo. Con este conocimiento, el sistema razona sobre cómo ejecutar las habilidades para completar la tarea.

Los investigadores demuestran que este método, al que llaman DiffSkill, puede realizar tareas de manipulación complejas en simulaciones, como cortar y extender la masa, o recoger trozos de masa alrededor de una tabla de cortar, superando a otros métodos de aprendizaje automático.

Los robots aprenden del cambio para realizar nuevas tareas y trabajos

Más allá de la elaboración de pizzas, este método podría aplicarse en otros entornos en los que un robot necesite manipular objetos deformables, como un robot cuidador que alimente, bañe o vista a una persona mayor o con problemas motrices.

"Este método se acerca más a la forma en que los humanos planificamos nuestras acciones. Cuando un ser humano realiza una tarea de largo alcance, no anotamos todos los detalles. Tenemos un planificador de alto nivel que nos dice a grandes rasgos cuáles son las etapas y algunos de los objetivos intermedios que tenemos que alcanzar por el camino, y luego los ejecutamos", dice Yunzhu Li.

Elon Musk habla de la guerra en Ucrania, de la importancia de la energía nuclear, y explica por qué Benjamin Franklin sería la persona "más divertida en una cena"

Entre los coautores de Li se encuentran el autor principal, Xingyu Lin, estudiante de posgrado de la Universidad Carnegie Mellon (CMU); Zhiao Huang, estudiante de posgrado de la Universidad de California en San Diego. 

Además, también han participado Joshua B. Tenenbaum, profesor de desarrollo profesional Paul E. Newton, catedrático de Ciencias Cognitivas y Computación del Departamento de Ciencias Cognitivas y del Cerebro del MIT y miembro del CSAIL; David Held, profesor adjunto de la CMU; y el autor principal, Chuang Gan, investigador científico del Laboratorio de Inteligencia Artificial MIT-IBM Watson.

La investigación se presentará próximamente en la Conferencia Internacional sobre el Aprendizaje de Representaciones.

DiffSkill: capaz de ser alumno y profesor

 El "profesor" en el marco de DiffSkill es un algoritmo de optimización de trayectorias que puede resolver tareas de horizonte corto, en las que el estado inicial de un objeto y la ubicación del objetivo están cerca.

El optimizador de trayectorias trabaja en un simulador que modela la física del mundo real (conocido como simulador de física diferenciable).

El algoritmo del "profesor" utiliza la información del simulador para aprender cómo debe moverse la masa en cada etapa, de una en una, y luego emite esas trayectorias.

A continuación, la red neuronal del "alumno" aprende a imitar las acciones del profesor. Como entradas, utiliza dos imágenes de cámara, una que muestra la masa en su estado actual y otra que muestra la masa al final de la tarea. La red neuronal genera un plan de alto nivel para determinar cómo enlazar las diferentes habilidades para alcanzar el objetivo.

A continuación, genera trayectorias específicas de corto horizonte para cada habilidad y envía órdenes directamente a las herramientas.

Manejo de más herramientas para poder desarrollar tareas más diversas

DiffSkill fue capaz de superar las técnicas populares que se basan en el aprendizaje por refuerzo, en las que un robot aprende una tarea mediante ensayo y error.

De hecho, DiffSkill fue el único capaz de completar con éxito las tres tareas de manipulación de la masa. Curiosamente, los investigadores descubrieron que la red neuronal "estudiante" era capaz incluso de superar al algoritmo “maestro”.

"Nuestro marco proporciona una forma novedosa de que los robots adquieran nuevas habilidades. Estas habilidades pueden encadenarse para resolver tareas más complejas que superan la capacidad de los sistemas robóticos anteriores", afirma Lin.

Robots que cocinan hamburguesas, fríen patatas y hasta limpian la plancha después de usarla: este es el futuro de los restaurantes de comida rápida

Como su método se centra en el control de las herramientas (espátula, cuchillo, rodillo, etc.), podría aplicarse a diferentes robots, pero solo si utilizan las herramientas específicas que los investigadores definieron.

Los investigadores pretenden mejorar el rendimiento de DiffSkill utilizando datos en 3D como entradas, en lugar de imágenes que pueden ser difíciles de transferir de la simulación al mundo real.

También quieren hacer más eficiente el proceso de planificación de la red neuronal y recoger datos de entrenamiento más diversos para mejorar la capacidad de DiffSkill de generalizarse a nuevas situaciones. A largo plazo, esperan que DiffSkill pueda realizar tareas más diversas, como la manipulación de telas.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.