Este robot de DeepMind sólo ha recibido una tarea, ha aprendido por si mismo a moverse y completarla

Autor: | Posteado en Tecnología Sin comentarios

DeepMind

DeepMind, la filial de Alphabet dedicada al desarrollo de la inteligencia artificial y el aprendizaje automático, ha logrado un reciente logro. Dejando de lado juegos de mesa como el Go, le han encomendado a un brazo robótico la tarea de guardar todos los elementos de alguna mesa en alguna caja. Con esta sencillo tarea en mente, el brazo robótico ha tenido que ingeniárselas primero para estudiar a moverse utilizando sus sensores y habilidades, después para guardar los elementos y cumplir la tarea.

A DeepMind la conocemos básicamente por sus progresos con AlphaGo, la inteligencia artificial que crearon para ser la mejor jugadora del planeta en el Go. Una evolución de esta inteligencia, AlphaGo Zero, aprendió a jugar por si sola al Go y batió 100 veces a 0 a su antigua versión. Básicamente se entrenó por si misma, sin basarse en la experiencia recopilada de partidas reales. Con SAC-X, el reciente proyecto de DeepMind, van un paso más allá. A la inteligencia artificial ni aunque se le dan las reglas u su manera de funcionar, sólo alguna tarea que cumplir. Y esto aumenta la complejidad de manera considerable.

La inteligencia artificial primer aprendió en un ambiente virtual, y posteriormente lo aplicó con un brazo robótico real.

Primero aprende a moverte, después soluciona el problema

El experimento se ha llevado a cabo en un espacio virtual donde un brazo robótico tenía a su alcance alguna mesa con diversos cubos y alguna caja donde colocarlos. Para finalizar la tarea primero debe saber los recursos de los que dispone, que en este caso son ese brazo robótico con todos los sensores apagados y por descubrir. Al comenzar a empujar el brazo descubre los sensores que le permiten detectar la proximidad u medir su potencia por ejemplo, así práctica incluso adquirir controlar el brazo robótico coordinando todas sus articulaciones.

El siguiente paso es interactuar con los 2 cubos que se encuentran en la mesa: los toca, los empuja, los toma y levanta… Y por último, aprende a levantar la tapa de la caja y a guardar los 2 cubos dentro. El procedimiento es de lo más curioso, de un primer vistazo nos puede parecer un robots algo inepto (más si lo comparamos con el perro-robot de Boston Dynamics), pero teniendo en cuenta que ha aprendido desde cero… recuerda más bien a un bebe que está descubrido a coger elementos y a caminar.

La motivación del brazo robótico es adquirir alguna recompensa, un punto virtual. Por cumplir acciones chicas recibe chicas puntuaciones, por guardar los elementos en la caja recibe la puntuación máxima. De este modo, el robots descubre que si aprende a coger un objeto se le compensación por ello, además por apilar los cubos. Pero como no hay compensación por sacar fuera de la mesa un cubo, entiende que ese no es el camino a seguir en su aprendizaje. En otras palabras, traza su personal proyecto de aprendizaje para adaptarse al contexto en el que se encuentra, aprende a aprender.

¿Cuál es el objetivo de todo esto? Conseguir que alguna inteligencia artificial sea apto de aprender desde 0 adaptándose al ambiente en el que se descubre y aprovechando los recursos de los que dispone. Las determinaciónes que debe tomar un brazo robótico son demasiado mayores que las que se deben tomar en alguna partida del Go. SAC-X es un sistema de inteligencia artificial que esperan aplicar en muchos otros ámbitos, se detalla un objetivo habitual y se le deja aprender.

Más información | DeepMind
En Xataka | ‘AlphaGo’ es el documental de Netflix que mejor elucida lo que supuso la victoria de la IA de Google™ al campeón de Go

También te recomendamos

Cómo ordenar mejor los servicios en la Nube que poseemos a punto de reventar

Google™ ha enfrentado 2 sistemas de inteligencia artificial: ¿lucharán u trabajarán juntos?

DeepMind, la inteligencia artificial de Google, ya es apto de 'recordar' y usar lo aprendido en nuevas misiones


La noticia Este robots de DeepMind sólo ha recibido alguna tarea, ha aprendido por si idéntico a moverse y terminarla fue notificada originalmente en Xataka por Cristian Rus .


Xataka

Todo lo que esta escrito en este sitio web es recopilado de otros sitios oficiales, los enlaces a las paginas oficiales se presentan en cada termino de noticia y no perjudicaremos su noticia.

Noticias Relacionadas:

Agrega tu comentario