Google desarrolla inteligencia artificial para silenciar voces indeseadas

¿Tus amigos te ponen la cabeza loca? Descubre la inteligencia artificial para silenciar voces

¿Tus amigos tienen la habilidad de ponerte la cabeza como un bombo cada vez que reunís en un bar? ¿Te ocurre lo mismo con tus compañeros de trabajo? Pues no pierdas la esperanza porque Google podría tener la solución.

Se trata de un proyecto que aún se encuentra en la laboratorio de experimentos, pero sus expertos han desarrollado un sistema inteligente capaz de analizar una conversación y dividir las voces para que podamos hacer una selección de lo que nos interesa.

Según han explicado desde Google a través de su blog oficial, este sistema de inteligencia artificial funciona con cualquier tipo de vídeo, teniendo el usuario sólo que seleccionar la cara de la persona a la que desea escuchar.

Aunque el resultado es sorprendente, por ahora, las voces que se presten a su análisis deben ser bastante diferentes para que el sistema funcione a la perfección. Aun así, las pruebas que Google ha colgado en su web reflejan que esta tecnología permitiría obtener videoconferencias con mejor sonido y, además, podríamos hacer o disfrutar de retransmisiones en varios idiomas sin dificultades técnicas.

Inteligencia artificial para silenciar voces

Como si se tratara de un nuevo capítulo de la serie Black Mirror, el nuevo sistema de inteligencia artificial de Google nos ofrece la opción de bloquear a personas en la vida real como ya podemos hacer a través de las apps de mensajería instantánea o en redes sociales. De hecho, el proyecto está inspirado en el ‘Efecto cóctel’, una capacidad de las personas para focalizar nuestra atención en una persona o varias personas concretas en un ambiente ruidoso o saturado. Ahora Google se enfrenta al reto de trasladar esta habilidad a la computación.

Así, ha creado el sistema ‘Looking to listen at the Cocktail Party’, un modelo audiovisual de aprendizaje profundo y basado en la inteligencia artificial, que permite aislar una sola señal de voz de una mezcla de sonidos como otras voces y ruido de fondo. Así, el usuario tan solo tendrá que seleccionar la cara de la persona que quiera escuchar para silenciar el resto de voces.