Reconocimiento de voz más preciso en un nuevo desarrollo de Google

“Quiero una pizza con piña” y, por fortuna, Google a veces no nos entiende…de momento

asistente de vozUna de las grandes tragedias de la humanidad, si olvidamos las demás, es pedir una pizza de piña a través de un asistente de voz y que este nos entienda.

Sin embargo, son más las ocasiones en las que hace oídos sordos, sobre todo si nuestra voz emerge entre otras, en incomprensible cacofonía. O quizás su sordera responda al extraordinario desarrollo de la inteligencia artificial, que nunca se sabe.

El 54% de la población española utiliza actualmente la tecnología de voz para realizar alguna acción en sus aparatos inteligentes y un 13% de los no usuarios se muestra abierto a su utilización en un futuro próximo. Sin embargo, y aquí viene el dato relevante, 3 de cada 4 usuarios declaran que los fallos experimentados en el reconocimiento de comandos les supone uno de los mayores inconvenientes para usar los asistentes basados en el reconocimiento de voz.

Para superar este contratiempo, Google presentó en 2018 VoiceFilter un sistema de inteligencia artificial que permitía discriminar la voz registrada en un dispositivo de otras. Ahora ha desarrollado una mejora de este sistema que solo ocupa 2,2MB lo que le hace idóneo para la multitud de aplicaciones de voz que en el mundo digital son.

Utiliza la voz ya registrada de un usuario y mejora el reconocimiento de voz incluso cuando hay otra voz superpuesta. Google afirma que el nuevo modelo de inteligencia artificial supera al anterior en un 25% en su capacidad de reconocimiento de palabras.

reconocimiento de voz solo en inglés

Una ventaja de este desarrollo es que no es necesario instalarlo obligatoriamente en el sistema de reconocimiento de voz. Por lo tanto, si la voz de un orador no se registró anteriormente, su aplicación puede omitir VoiceFilter-Lite y continuar con los comandos de reconocimiento. Esto tambiénes útil si un usuario registrado desea enviar algunos comandos a un asistente digital en modo incógnito.

Bien, pero no hay motivo para que los hispanohablantes nos vengamos muy arriba. Habrá que esperar para que los investigadores desarrollen este modelo, que hoy solo está disponible en inglés, en otros idiomas. Hasta entonces, antes de hablar a nuestro asistente tendremos que seguir silenciando los abucheos cuando encarguemos esa pizza con piña o pidamos la receta de la tortilla con cebolla que, como su nombre indica, lleva tortilla y lleva cebolla. Y mucha crueldad.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *