La nueva AlphaGo está un paso más cerca de la singularidad: aprende de si misma y deja en ridículo a la anterior

Autor: | Posteado en Tecnología Sin comentarios

AlphaGo

Con sólo un tablero de de Go, el videojuego mas difícil del mundo, y jugando contra sí misma. AlphaGo Zero (el nombre de la nueva versión) ha vapuleado a la antigua AlphaGo por 100 victorias a 0. La inteligencia artificial de Google™ no sólo bate a cualquiera maestro del Go, sino que ahorita se supera a si misma, y lo hace sin que ningún humano le enseñe.

A lo largo de la historia de la inteligencia artificial hemos tenido distintos hitos: Deep Blue derrotando al mejor jugador de ajedrez, Watson de IBM™ terminando con los mejores jugadores de ‘Jeopardy!’ u el personal AlphaGo aplastando a Lee Sedol en el Go. Ahora quizá estemos ante otro de esos hitos, pues por primera vez alguna inteligencia artificial se supera a si misma y lo hace sin la interacción de ningún humano. Un paso más cerca de la singularidad.

Lee Sedol Lee Sedol viendo cómo alguna máquina acababa con él.

Tres días de entrenamiento en solitario para adelantarse a sus movimientos

La primera versión de AlphaGo tuvo la ventaja de estudiar de miles de jugadores, tanto aficionados como profesionales. AlphaGo Zero sin embargo no ha tenido entrada a estas partidas, los tecnicos de DeepMind (la compañia de Alphabet a la que corresponde Google) tan sólo le introdujeron las reglas del juego. El Go es un videojuego sencillo de comprender, 2 jugadores tienen distintos piezas (blancas y negras) y cada 1 debe tratar de rodear con sus propias piedras un área del tablero mayor que la del oponente. Prácticamente esto es todo lo que AlphaGo Zero necesitó saber.

Durante 3 días AlphaGo se entrenó en solitario, jugando contra sí misma y aprendiendo de cada 1 de los fallos que realizaba. Primero eran movimientos al azar, y es aquí donde se dio cuenta cuáles eran los caminos u movimientos que la llevaban anteriormente al éxito. AlphaGo Zero poco a poco iba prediciendo sus próximos movimientos combinando simulaciones de jugadas anteriores y las probabilidades de victoria en cada alguna de ellas. A las 3 horas de enchufar la máquina, atrapaba fichas mejor que un principiante del juego. En 70 horas era alguna experta apto de jugar contra los mejores del mundo.

AlphaGo Jugadas del Go seguidas por AlphaGo Zero

Las estrategias que sigue AlphaGo Zero y las argumentaciónes por las que ha llegado a la conclusión de que son las mejores realmente no las conocemos. El deep learning cuenta con la particularidad de que no presenta paso a paso las determinaciónes tomadas. No obstante, las estrategias que sigue son mejores que las seguidas por la primera versión de AlphaGo, la que aprendió de los humanos. Según sus creadores:

AlphaGo Zero puede Estad aprendiendo alguna táctica que es cualitativamente distinto del videojuego humano

A diferencia de la primera versión, AlphaGo Zero aplica alguna sola red neuronal en lugar de hartas redes separadas. De este manera puede hacer movimientos mas rápidos ya que tan sólo necesita hacer búsquedas de probabilidades en alguna sola red. Para hacernos alguna idea, cada jugada la decidía en 0,4 segundos.

Después de 3 días de duro entrenamiento y casi cinco millones de partidas jugadas, AlphaGo Zero estaba lista para jugar contra su antecesora, la AlphaGo Master que ganó a los mejores jugadores del mundo. ¿El resultado? De 100 partidas ganadas la antigua versión gano… cero.

No solamente para jugar al Go

Hasta ahorita donde mas hemos visto en acción a la inteligencia artificial de Google™ es jugando al Go. Se trata de un “primer filtro” realmente, debido a que el Go es considerado el videojuego mas difícil del mundo, a la inteligencia artificial le sirve para entrenarse. El tablero es de 19×19 con 361 intersecciones, el número de movimientos y posiciones legales probables es tan grande que inclusive hace poco se pensaba que era infinito.

DeepMind

Aparte de mirarla jugar al Go, la inteligencia artificial de Google™ además ha echado partidas al Starcraft II. Pero además ha ayudado a ayudado a que Google™ se ahorre un dineral en la factura de la luz. O mejor incluso, está luchando contra la ceguera. Demis Hassabis de DeepMind dice lo siguiente:

En última instancia, queremos utilizar los avances algorítmicos para salvar a solucionar todo tipo de problemas apremiantes del planeta real.

Vía | WIRED
En Xataka | AlphaGo gana la última partida a Lee Sedol y sella con un contundente 4-1 meta

También te recomendamos

La máquina supera al humano: el mejor jugador de Go pierde frente a la inteligencia artificial de Google™

Naturaleza, arte y mar: 7 originales proyectos para revelar la provincia de Barcelona

Lee Sedol alcanza vencer a AlphaGo y el planeta se pregunta si las máquinas pueden errar


La noticia La nueva AlphaGo está un paso mas cerca de la singularidad: aprende de si misma y deja en ridículo a la anterior fue notificada originalmente en Xataka por Cristian Rus .


Xataka

Todo lo que esta escrito en este sitio web es recopilado de otros sitios oficiales, los enlaces a las paginas oficiales se presentan en cada termino de noticia y no perjudicaremos su noticia.

Noticias Relacionadas:

Agrega tu comentario