La inteligencia artificial de Google pasa de la asistencia humana

DeepMind, la división de inteligencia artificial de Google, derriba otro muro para la inteligencia artificial. El sistema AlphaZero no perdió ninguna de las 100 partidas de ajedrez que jugó contra el mejor programa informático de ajedrez del mundo, Stockfish, con la particularidad de que no necesitó de la asistencia humana para alzar el título mundial del campeonato no oficial de juegos de mesa para máquinas. Impresionante: lo ha hecho todo por su propia cuenta.

Este proyecto es revolucionario en el tanto se trata de un sistema de inteligencia artificial que no se impulsa con el aprendizaje automático (en el que los seres humanos juegan un papel fundamental, pues brindan toda la información necesaria para que la máquina tome decisiones). En cambio, AlphaZero aprende a jugar contra sí misma en un ejercicio de ensayo y error que los científicos denominan «aprendizaje por refuerzo«.

El sistema aprendió a jugar ajedrez en tan solo nueve horas, y con ello fue suficiente para vencer a su contrincante. También aprendió a vencer en el shogi –la versión japonesa del ajedrez– en tan solo 12 horas, y el go –un juego que requiere de una estrategia bastante compleja– en 13 días. Los tres son considerados los juegos de tablero más exigentes para el cerebro humano, y los tres tienen un nuevo rey a la vista: el invencible AlphaZero.

Las maravillosas lecciones de AlphaZero

La proeza del último sistema de inteligencia artificial de DeepMind es el objeto de la portada de la revista Science esta semana (disponible en inglés aquí). Pese a no haber sido diseñado para ninguno de estos juegos, el programa no solo puede dominarlos sino que también descubrió nuevas formas de juego que los humanos no han puesto en práctica. Al sistema le importa muy poco el conocimiento que la humanidad ha adquirido sobre estos juegos con el paso de los siglos.

Aunque hay sistemas de inteligencia artificial capaces de realizar tareas más complicadas, los juegos de tablero siguen siendo un campo de experimentos para estos avances tecnológicos, después de que hace dos décadas el programa Deep Blue de IBM derrotó al campeón mundial de ajedrez, Gary Kasparov. «Como demuestra AlphaZero, el dominio de las máquinas no acaba con el papel histórico del ajedrez como laboratorio cognitivo», dijo Kasparov, según una cita del informe.

Mientras los programas diseñados específicamente para ganar estos juegos con dificultad consiguen una victoria entre miles de derrotas, AlphaZero solo necesita saber las reglas y dimensiones del tablero para ganar y ganar, inclusive si tiene menos tiempo y más obstáculos que sus rivales. Toma decisiones al azar y rápidamente descubre las jugadas que los humanos desarrollaron durante siglos, sin recibir pistas de nadie. Y, después, inventa jugadas nunca antes vistas.

Por ejemplo, en el ajedrez sacrifica algunas de sus mejores fichas al inicio de la partida previendo que al final será un paso que sumará puntos, pero pocos humanos pueden ver el juego de esta forma, y menos con poco tiempo de aprendizaje. «Está libre de las limitaciones del modo en que los humanos piensan sobre el juego», explica Demis Hassabis, de DeepMind, en declaraciones recogidas por El País. El diario se hace eco también de expertos que explican que, aunque sorprendentes, los logros de la máquina no son aplicables a la vida real.

«No puedo disimular mi satisfacción al ver que juega con un estilo muy dinámico, muy parecido al mío», dijo el ex campeón de ajedrez, Kasparov. «Su estilo de juego único nos muestra que hay nuevas posibilidades para el juego del shogi”, manifestó Yoshinaru Habu, la única persona que ha ganado los siete títulos principales de este juego.