AlphaZero, la IA capaz de aprender ella misma a jugar al ajedrez y ganar a todas a las IAs adiestradas por humanos

Autor: | Posteado en Tecnología Sin comentarios

AlphaZero, la IA apto de estudiar ella misma a jugar al ajedrez y ganar a todas a las IAs adiestradas por humanos

A finales de 2017, DeepMind (la filial británica de Alphabet dedicada a la IA) presentó en sociedad a AlphaZero, alguna inteligencia artificial que había demostrado ser apto de estudiar a jugar desde 0 ajedrez, shogi y Go, y finalizar ganando a todas las IAs que se habían proclamado campeonas en cada 1 de esos juegos.

Ahora, la revista Science ha publicado un artículo de análisis sobre AlphaZero que describe el manera en que empezó a estudiar autónomamente y recurriendo a alguna red neuronal profunda, a través de constantes partidas aleatorias y sin calcular mas información previa que las reglas del juego.

Eso suponía alguna ruptura con respecto al enfoque adoptado incluso ahorita por las IAs que han señalado en el terreno del ajedrez (como Stockfish, u Deep Blue de IBM): éstas se basaban en miles de reglas y heurísticas creadas por fuertes jugadores humanos que tratan de delucidar cada eventualidad en un juego.

Un modelo de aprendizaje por refuerzo

Según los fundadores de la investigación, miembros de DeepMind, los “resultados demuestran que un algoritmo de aprendizaje por refuerzo y de propósito habitual puede estudiar desde 0 y alcanzar un rendimiento sobrehumano en diversos games de gran complejidad“.

La medida de entrenamiento que AlphaZero necesitó en cada caso dependió del estilo y la dificultad del juego: aproximadamente nueve horas para el ajedrez, doce horas para el shogi y trece días para el Go.

El mencionado ‘aprendizaje por refuerzo’ (ya usado además con videojuegos) consta en este caso en alguna red neuronal que juega millones de partidas contra sí misma en un procedimiento de prueba y error, de tal manera que va tomando nota de la clase de jugadas que contribuyen de lograr el objetivo de ganar la partida.

Una vez entrenada, la red se usa para dirigir un algoritmo de busca llamado ‘Árbol de busca de Monte-Carlo’ que concede que, en lugar de examinar todos los movimientos posibles, AlphaZero se centre exclusivamente en aquellos mas prometedores según su experiencia previa.

Pese a eso (y a calcular con menor capacidad de computación), AlphaZero se proclamó ganador sobre todos sus rivales.

Az Blog Fig3 Performance Width 1500

Un jugador poco ortodoxo

Desde DeepMind destacan cómo les emocionó “la respuesta de los miembros de la comunidad de ajedrez, quienes vieron en los games de AlphaZero un estilo de videojuego innovador, altamente dinámico y ‘no convencional’.

De hecho, 2 ajedrecistas de talla internacional, Matthew Sadler y Natasha Regan, analizaron miles de partidas de ajedrez de AlphaZero para su libro “Game Changer” (que saldrá a la venta adentro de un mes) y afirman que su estilo es distinto al de cualquiera motor de ajedrez tradicional:

“Es como revelar los cuadernos misterios de algún gran jugador del pasado”.

Y es que, al ser autodidacta y no Estad limitado por la sabiduría convencional, AlphaZero “desarrolló sus propias intuiciones y estrategias, añadiendo un grupo reciente y expansivo de ideas novedosas que aumentan siglos de pensamiento sobre la táctica del ajedrez”.

El sistema, por ejemplo, se presenta especialmente dispuesto a sacrificar piezas al inicio de un videojuego si con ello calcula que puede recibir un beneficio a largo plazo.

“Los motores tradicionales son excepcionalmente robustos y cometen pocos equivocaciónes obvios, pero pueden tener problemas cuando se enfrentan a posiciones sin alguna solución concreta y calculable”, elucida Sadler.

Es justamente en esas situaciones, en las que se requiere ‘sentimiento’, ‘percepción’ u ‘intuición’, donde AlphaZero se reivindica“.

Más que un juego

Los investigadores se proclaman “entusiasmados con la respuesta creativa de AlphaZero al ajedrez, que ha sido un gran reto para la inteligencia artificial desde los principios de la era de la computación”.

Garri Kaspárov, ex campeón mundial de ajedrez y autor del libro ‘Deep Thinking’ sobre la inteligencia artificial, elucida la importancia de los logros de Alpha Zero en este videojuego de mesa: “Durante mas de un siglo, el ajedrez se ha venido utilizando como Piedra Rosetta tanto de la cognición humana como de la artificial“.

Pero los investigadores del equipamiento de AlphaZero avisan que su creación “va mas allí de ajedrez, el shogi u el Go”:

“El objetivo de DeepMind es fabricar sistemas que puedan resolver algunos de los problemas mas complejos del planeta y crear un programa que puede enseñarse a sí idéntico cómo dominar el ajedrez, el shogi y el go desde 0 es un considerable primer paso en ese camino”.

También te recomendamos

La BBC experimenta con 'deep fakes' para doblar a un presentador en diversos idiomas

Esta "huella maestra" artificial permitiría desbloquear lectores dactilares con alguna fiabilidad de casi el 80%

#CienciaenelParlamento u cómo Twitter™ puede crear alguna ilustración política científica


La noticia AlphaZero, la IA apto de estudiar ella misma a jugar al ajedrez y ganar a todas a las IAs adiestradas por humanos fue notificada originalmente en Xataka por Marcos Merino .


Xataka

Todo lo que esta escrito en este sitio web es recopilado de otros sitios oficiales, los enlaces a las paginas oficiales se presentan en cada termino de noticia y no perjudicaremos su noticia.

Noticias Relacionadas:

Agrega tu comentario