La inteligencia artificial aprende a jugar al Stratego a nivel experto
El Stratego pone a prueba la capacidad de tomar decisiones relativamente lentas, deliberadas y lógicas de forma secuencial, se trata de un juego de información imperfecta, es decir, que algún aspecto de este se oculta a los oponentes
La Inteligencia Artificial (IA) ha aprendido a dominar muchos juegos, pero hasta ahora se le resistía el Stratego, sin embargo un grupo de investigadores ha logrado que un nuevo agente de IA llamado DeepNash alcance el nivel experto e incluso consiga ganar a las personas.
El Stratego pone a prueba la capacidad de tomar decisiones relativamente lentas, deliberadas y lógicas de forma secuencial, se trata de un juego de información imperfecta, es decir, que algún aspecto de este se oculta a los oponentes.
Más información
Por ello, este juego de mesa de estratega militar ha constituido una de las próximas fronteras de la investigación en Inteligencia Artificial, señala Science, donde se publica el estudio.
Ahora, DeepNash ha logrado jugar a nivel experto lo que representa un "resultado extraordinario que la comunidad de Stratego no creía posible con las técnicas actuales", según los autores del estudio, encabezado por la compañía de Inteligencia Artificial DeepMind
Stratego plantea retos clave a los investigadores de la IA debido a los numerosos aspectos complejos de su estructura, entre ellos tener más estados posibles que otro juego de información imperfecta muy estudiado: el póker Texas Hold'em sin límite.
De hecho, el juego se caracteriza por un doble reto: por un lado requiere un pensamiento estratégico a largo plazo como en el ajedrez, por otro tratar con información imperfecta como en el póker.
Actualmente, no es posible utilizar técnicas de búsqueda de información imperfecta para dominar Stratego, por lo que el equipo encabezado por Julien Perolat ideó un método que permite a una IA aprender a jugar.
El nuevo método dio lugar a un "bot" llamado DeepNash, cuyo núcleo es un algoritmo de aprendizaje por refuerzo, R-NaD, lo que le permitió alcanzar un rendimiento de nivel humano en la variante más compleja del juego, Stratego Classic.
Para hacer DeepNash, el equipo combinó el agoritmo R-NaD con una arquitectura de red neuronal profunda para aprender una estrategia que juega a un nivel altamente competitivo.
Este resultado se logró, destacaron los autores, sin desplegar ningún método de búsqueda, un ingrediente clave para muchos logros de la IA en los juegos de mesa en el pasado.
DeepNash fue probado contra varios "bots" de Stratego de última generación, ganando a todos, y alcanzó un nivel de juego muy competitivo frente a jugadores humanos expertos, lo que le ha llevado a lograr el tercer puesto en lo que va de año y de todos los tiempos en la plataforma de juegos Gravon, compitiendo con jugadores humanos expertos.