El gran paso de la inteligencia artificial: usa lo aprendido en una tarea para la siguiente

Al poco de que os contásemos cómo aprenden los robots por refuerzo, por imitación y por aprendizaje profundo, se produjo una esperada noticia en el mundo de la inteligencia artificial: DeepMind, la IA de Google, ya podía usar lo aprendido de una tarea y llevárselo a otra.

Hasta ahora, las IA han batido récords exprimiendo al máximo una serie de reglas o normas en un ámbito concreto, pero siendo imposible el llevar lo ganado de una aplicación a otra. DeepMind puede hacerlo gracias a un mecanismo llamado consolidación de peso elástico. Las IA ahora tienen memoria, o el principio de una.

Las IA y el aprendizaje

Sin repetirnos en lo que ya dijimos sobre el aprendizaje por refuerzo, imitación o profundo, podemos resumir que hasta ahora las inteligencias artificiales han aprendido como los humanos lo hacen en las primeras fases de la vida. Y lo han hecho en compartimentos estancos sin ninguna permeabilidad.

Para entenderlo, pensemos en un bebé que gatea por el suelo y cuyo objetivo es llegar a un biberón. Por ser un humano ya lleva de serie un cerebro que le permite el aprendizaje profundo, por supuesto. Pero, aunque haya alcanzado diez veces con anterioridad el codiciado premio (aprendizaje por refuerzo), y aunque haya optimizado el algoritmo de su gateo mirando a sus padres (aprendizaje por imitación), no sabrá cómo se abre el biberón si nunca lo ha intentado. Para el bebé, el biberón será un problema nuevo con nuevas normas.

Ese era el estado del arte de la inteligencia artificial hasta marzo de 2017: sabe gatear pero eso no le ayuda a abrir el biberón. Lo aprendido al resolver cada problema no les servía de nada para el problema siguiente. Con cada nuevo reto había que volver a la posición de partida, fallar, iterar, volver a fallar, tomar un camino diferente, fallar, volver a intentarlo…

inteligencia artificial iterando

Pero ahora la inteligencia artificial tiene una herramienta humana más, la consolidación de peso elástico (EWC por sus siglas en inglés), que le permite llegar más lejos en su aprendizaje. O, al menos, alcanzar ese lejos en un tiempo menor y usando menos recursos. Lo que ya es un logro en sí mismo.

Consolidación de peso elástico, ¿y eso, qué es?

Hagamos un repaso rápido a través de los grandes hitos de la inteligencia artificial en la disciplina «darle una paliza a los seres humanos». No, no hablamos de Cylons viendo cómo son los humanos por dentro, sino de juegos de mesa que ahora son dominio IA:

  • 1990: la IA Chinook queda segunda a las damas frente a Marion Tinsley.
  • 1995: tras su muerte, Chinook pasa a la cabeza aún imbatible.
  • 1997: la IA DeepBlue gana a Kasparov al ajedrez, ya sin opción a excusas. El mismo año Logistello derrota 6 a 0 a Murakami al reversi.
  • 2016: la IA AlphaGo derrota al juego go a Lee Sedol.
  • 2017: la IA Libratus gana al póker sin límite Texas Hold’em.

Sí, la noticia podría ser que «las inteligencias artificiales nos están dejando sin puestos de trabajo especializados y sin juegos de mesa», pero hay algo más.

Hasta ahora, las inteligencias artificiales han tenido que diseñarse de manera expresa para ganar cada uno de estos juegos. Sin embargo, podemos afirmar con cierta seguridad que el mismo Lee Sedol del go podría convertirse en un buen jugador de ajedrez. A diferencia de las IA, no es necesario que sus padres generen otro Lee para ello.

Eso que tenían los seres humanos pero las IA no (entre otros elementos) es el consolidador de peso elástico (EWC): un mecanismo que rescata fragmentos de código usado en aplicaciones similares a aplicaciones presentes.

En el caso de los juegos, el EWC es esa parte del software humano que nos chiva: «¡Eh! ¿Te has dado cuenta en que el peón del ajedrez se mueve de un modo parecido al de las damas?». Es el mismo tipo de algoritmo que susurra a los bebés: «Oye, tú, pequeñajo, las piernas que has usado para barrer el suelo te sirven para ponerte de pie, y funcionarán más o menos igual de mal».

inteligencia artificial aprendiendo

Como dice el neurólogo David Eagleman, «el cerebro humano es una máquina multipropósito». Aunque los procesadores de las IA técnicamente lo son también (lo mismo te resuelven una operación que otra), su software de partida no lo es.

El EWC de la inteligencia artificial y el EWC de los humanos

El consolidador de peso elástico es el mecanismo que activa la memoria almacenada, incluso tiempo atrás, y usa ese conocimiento previo para construir más conocimiento en la resolución de un problema. Pero incluso los humanos tenemos el parámetro EWC configurado muy bajo (salvo casos excepcionales).

Del mismo modo que un humano usa un 10% de su cerebro (si usásemos el 100% no seríamos LUCY, sino un epiléptico), por lo general no puede acceder al 100% de su memoria y de lo aprendido. Salvo excepciones, nadie lo recuerda todo. Motivo por el que muchas veces encontramos la respuesta óptima escondida en nuestra memoria mucho tiempo después de haber parcheado un problema con una segunda solución.

«¡Ah, es verdad, se hacía así!», pensamos. Y nos mentimos: «ya para la siguiente vez me acuerdo.»

Imaginemos el acceso al EWC como un porcentaje del 0 al 100. Un consolidador de peso elástico muy bajo, del 0,01%, hace que la IA o el humano no relacione un aprendizaje previo con un problema nuevo. Uno muy alto, cercano al 99,99%, hace que se bloquee o incluso acabe sangrando por la nariz, porque un EWC elevado haría pesado cualquier proceso.

inteligencia artificial más lista

«Qué IA más lista», podríamos decir al ver los datos de consumo eléctrico del procesador. Sin darnos cuenta de que gasta todo su poder de computación comprobando las relaciones entre el nuevo problema y todos los problemas previos en lugar de resolviendo el problema. Lo que se conoce como Paralysis by analysis, aplicado a la inteligencia artificial.

Entonces, ¿las IA son más listas ahora?

Sí y no, a la vez, aunque más bien quizá. Es improbable que consigamos un consenso, especialmente teniendo en cuenta que nos cuesta definir palabras muy usadas hoy día como inteligencia.

Si resolver el mismo problema más rápido con menos potencia es una muestra de inteligencia, entonces sí, probablemente las inteligencias artificiales sean a raíz del DeepMind más listas.

Pero, salvo programas de televisión, nosotros no consideramos más inteligente a un humano de respuestas rápidas (aunque estas sean acertadas). Decimos que tiene una memoria buena y, si está resolviendo un problema, decimos simplemente que es resolutivo. Pero no relacionamos la inteligencia con la velocidad, y ni de cerca decimos que es más sabio.

El mecanismo del consolidador de peso elástico es un sistema que ayuda a alcanzar una solución en parte conocida. De modo que como mucho podríamos decir que la IA es más avispada al darse cuenta de que parte del problema ya estaba resuelta.

Para muchos, que las IA se vuelvan inteligentes supone un ataque de tecnofobia. Pero según los expertos estos miedos son infundados. Primero, porque nuestras inteligencias artificiales están en pañales y, segundo, porque lo más inteligente que puede hacer una IA es pasar de los humanos (y de momento siguen jugando a nuestros arcade cuando se lo pedimos). Muy inteligentes no son.

En Nobbot | Arte usando medios digitales: inteligencia artificial vs. artista humano

Imágenes | iStock/Voyagerix, iStock/IPGGutenbergUKLtd, iStock/IPGGutenbergUKLtd, iStock/solvod

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *