Los científicos del Instituto de Tecnología de Massachusetts (MIT, por sus siglas en inglés) desarrollaron una metodología que permite fusionar el razonamiento jerárquico con la ejecución de movimientos para implementarla en un robot que aprende a jugar Torre Jenga.

El estudio titulado “Aprendizaje jerárquico para habilidades de manipulación compleja con sensores multifuncionales”, fue publicado en la revista Science Robotics, donde se describen los detalles del ‘Robot Jenga’, como se le ha catalogado.

Aquí, proponemos una metodología para emular el razonamiento jerárquico y la fusión multisensorial en un robot que aprende a jugar a Jenga, un juego complejo que requiere que la interacción física se ejecute de manera efectiva.

De acuerdo con los investigadores, el robot es capaz de realizar lo que ha representado un desafío en humanoides anteriores, y es la capacidad de aprender no solo a interactuar mediante la visión sino también de interacciones físicas y táctiles en tiempo real, así como simular los movimientos en una torre jenga real.

Alberto Rodríguez, uno de los científicos y profesor del MIT explica:

A diferencia de las tareas o juegos más puramente cognitivos, como el ajedrez o el Go, el juego de Jenga también requiere el dominio de habilidades físicas como sondear, empujar, jalar, colocar y alinear piezas. Requiere percepción y manipulación interactivas, donde se tiene ir y tocar la torre para aprender cómo y cuándo mover bloques.

Esto es muy difícil de simular, por lo que el robot tiene que aprender en el mundo real, interactuando con la torre Jenga real. El desafío clave es aprender de un número relativamente pequeño de experimentos explotando el sentido común sobre los objetos y la física.

El principal autor del artículo es el estudiante graduado del MIT Nima Fazeli. El equipo también está formado por Miquel Oller, Jiajun Wu, Zheng Wu y Joshua Tenenbaum, profesor de ciencias cerebrales y cognitivas en el MIT.

Esta herramienta permite agregar, eliminar y modificar objetos en fotografías con IA

Como muchos sabemos, el juego de la torre Jenga requiere no solo de cierto nivel de precisión, sino también concentración y equilibrio, puesto que la idea del juego es extraer cada uno de sus bloques y colocarlo en un nuevo nivel de la torre sin que esta se caiga.

Si para los humanos resulta complicado este tipo de retos, a la hora de programar un robot que realice los movimientos de forma autónoma sin duda lo es aún más.

Es por eso que los investigador del MIT idearon este sistema mucho más eficiente basado en la actividad cognitiva y literalmente inspirado en los movimientos de los humanos al ejecutar el juego.

El equipo personalizó un brazo robótico ABB IRB 120 estándar de la industria, luego instaló una torre Jenga al alcance del robot y comenzó un período de entrenamiento, en el que el robot eligió primero un bloque aleatorio y una ubicación en el bloque contra el cual empujar. Luego ejerció una pequeña cantidad de fuerza en un intento de empujar el bloque fuera de la torre.

La mecánica del juego se formuló como un proceso generativo, mediante un modelo bayesiano jerárquico temporal, con representaciones de comportamiento y estados de los bloques.

La computadora captura la información visual y táctil mediante las cámaras, y el robot aprendió modelos probabilísticos de estas relaciones entre la fuerza y ​​dominios visuales a través de una corta fase de exploración. Como resultado, el robot aprende a decidir si debe empujar o cambiar a otro bloque –en tiempo real.

Sin duda un gran avance en la robótica que no solo puede implementarse en juegos de concentración y equilibrio como la torre jenga, sino en otros aspectos de la vida cotidiana.

Más en TekCrispy