Desde los primeros días del ajedrez virtual y el solitario, los videojuegos han sido un campo para el desarrollo de la inteligencia artificial (IA). Cada victoria ha ayudado a hacer que los algoritmos sean más inteligentes y eficientes.

Pero para abordar problemas del mundo real, como automatizar tareas complejas, conducir o negociar, estos algoritmos deben navegar por entornos más complicados que los juegos de mesa y aprender a trabajar en equipo. Enseñar a la IA cómo trabajar e interactuar con otros jugadores para tener éxito había sido una tarea insuperable, hasta ahora.

Entrenando algoritmos

En un nuevo estudio, los investigadores detallaron una forma de entrenar algoritmos de inteligencia artificial para alcanzar niveles humanos de rendimiento en un popular juego multijugador en 3-D: una versión modificada de Quake III Arena.

Los bots FTW aprendieron a jugar a la perfección con humanos y otros bots, e incluso desarrollaron estrategias cooperativas clásicas,

Aunque la tarea de este juego es sencilla, dos equipos opuestos compiten para capturar las banderas del otro al navegar por un mapa, ganar exige una toma de decisiones compleja y la capacidad de predecir y responder a las acciones de otros jugadores.

Para entrenar a la IA para trabajar en equipo, los científicos crearon 30 bots diferentes y los enfrentaron entre sí en una serie de coincidencias en mapas generados al azar. Los bots se entrenaron usando algoritmos inspirados en el cerebro llamados redes neuronales, que aprenden de los datos al alterar la fuerza de las conexiones entre las neuronas artificiales.

Inicialmente los bots actuaron al azar. Pero cuando sus acciones obtuvieron puntos, las conexiones que llevaron al comportamiento se fortalecieron a través de un proceso llamado aprendizaje por refuerzo.

El programa de entrenamiento también eliminó a los bots que tendían a perder y los reemplazó con copias mutadas inspiradas en los mejores jugadores, muy similar a la forma en que la variación genética y la selección natural ayudan a los animales a evolucionar.

Desarrollo de estrategias cooperativas

Después de 450.000 partidas, los investigadores llegaron al mejor bot, al que llamaron For The Win (FTW). Los equipos de bots FTW superaron consistentemente a todos los demás equipos, aunque los humanos emparejados con bots FTW pudieron vencerlos el 5 por ciento del tiempo.

Los agentes de AI usaron el trabajo en equipo para derrotar a los jugadores humanos en el videojuego Quake III Arena.

Los bots FTW aprendieron a jugar a la perfección con humanos y otros bots, e incluso desarrollaron estrategias cooperativas clásicas, como seguir a los compañeros de equipo para superar a los oponentes en los tiroteos posteriores, y merodear cerca de la base enemiga cuando su compañero de equipo tiene la bandera para agarrarla inmediatamente cuando reaparece.

En el campo de la inteligencia artificial, esto constituye un gran avance. Nunca antes una computadora ha sido lo suficientemente competente en interacciones sociales complejas, como predecir cómo se comportarán los demás, para navegar y ganar en juegos de varios jugadores.

Por supuesto, incluso los juegos más complejos siguen estando muy lejos de la vida real, pero si la IA puede aprender a trabajar en equipo, podría hacer de todo, desde autos que conducen por sí mismos y que evitan choques coordinándose entre sí, hasta asistentes quirúrgicos robóticos que ayudan a los médicos durante los procedimientos.

Referencia: Human-level performance in 3D multiplayer games with population-based reinforcement learning. Science, 2019. https://doi.org/10.1126/science.aau6249