Las ilusiones visuales también engañan a la inteligencia artificial

Una red neuronal de convolución es un tipo de red neuronal artificial donde las neuronas se organizan en campos receptivos de una manera muy similar a las neuronas en la corteza visual de un cerebro biológico. Una investigación concluye que también son engañadas por ilusiones visuales.

Hoy en día, las redes neuronales de convolución (CNN) se encuentran en una variedad de sistemas autónomos (por ejemplo, en sistemas de detección y reconocimiento de caras, en coches de conducción automática, etc.). Este tipo de red resulta muy efectiva en muchas tareas de visión artificial, como por ejemplo en clasificación y segmentación de imágenes, entre otras muchas aplicaciones.

Las redes de convolución nacieron inspiradas en el comportamiento del sistema visual humano, en particular en su estructura básica formada por la concatenación de módulos compuesto por una operación lineal seguida por una operación no lineal. Un estudio publicado en la edición avanzada en línea de la revista Vision Research aborda el fenómeno de las ilusiones visuales en las redes de convolución en comparación con su efecto en la visión de los seres humanos. Un trabajo de Alexander Gómez Villa, Adrian Martín, Javier Vázquez-Corral, Marcelo Bertalmío, miembros del Departamento de Tecnologías de la Información y las Comunicaciones (DTIC) y realizado con la participación del investigador Jesús Malo de la Universidad de Valencia.

ilusiones visuales vs. inteligencia artificial

“Dada esta conexión de las CNN con nuestro sistema visual, en este trabajo hemos querido ver si las redes de convolución sufren de problemas similares a nuestro sistema visual. Para ello nos hemos centrado en las ilusiones visuales. Las ilusiones visuales son imágenes que nuestro cerebro percibe de manera diferente a lo que son en realidad”, explica Gómez Villa, primer autor del estudio.

Los autores, en su estudio, entrenaron las CNN para tareas simples que la visión humana también desarrolla, como por ejemplo la eliminación de ruido y del efecto de difuminación (blur, en inglés). Lo que han observado ha sido que, estas redes CNN entrenadas en estas circunstancias experimentales también son «engañadas» por ilusiones visuales de brillo y color de la misma forma que las ilusiones visuales engañan a los humanos.

Además, explica Gómez Villa “para nuestro trabajo analizamos también cuándo este tipo de ilusiones causan respuestas en la red que no son las esperadas físicamente, pero que tampoco coinciden con la percepción humana”, es decir, casos donde la CNN obtiene una ilusión óptica que es diferente a la ilusión que percibe el ser humano.

Los resultados de este trabajo son consistentes con la hipótesis de que las ilusiones visuales son un subproducto de la optimización de la visión humana a imágenes naturales (aquellas que un humano ve en su día a día). Al mismo tiempo, estos resultados muestran las limitaciones y las diferencias del sistema visual humano y las redes neuronales artificiales CNN.

Por cierto, en la imagen que encabeza este artículo, en los tres casos la Sagrada Familia tiene el mismo color, pero se ve de forma diferente por los colores que le rodean. Esto es una ilusión visual.

Relacionado

Esta ilusión visual con la Sagrada Familia engañaría también a una inteligencia artificial

ilusiones visuales vs. inteligencia artificial

Deja una respuesta Cancelar la respuesta