¿De verdad la IA puede traducir a los bebés?

Una española está desarrollando una IA que traduzca a los bebés

A la inteligencia artificial se le plantean constantemente nuevos retos: conducción autónoma, conocimiento del consumidor, diagnóstico de enfermedades… Y también viejas aspiraciones como entender qué quiere decir un bebé cuando llora. Ahora, ese logro podría estar más cerca.

Y todo gracias a la española Ana Laguna, data scientist en BBVA Data & Analytics y madre de dos niños. Tras su primer embarazo, Laguna se hizo la siguiente pregunta: ¿podría la IA ayudarle a comprender lo que su bebé necesitaba?

Un proceso meticuloso

Quería desarrollar un algoritmo capaz de identificar los diferentes tipos de lloro. Su hipótesis partía de la idea de que esos llantos tienen patrones, pero nunca se habían clasificado. Laguna ha trabajado en el campo de la traducción automática. Por eso, pensó que un medio de expresión oral como es el llanto también podía ser analizado.

Para ello, en primer lugar, comenzó a grabar a su bebé a diario. Fue durante cuatro meses y con muestras de al menos 10 segundos de duración. Quería configurar una base de datos lo más amplia posible y así constituir diferentes etiquetas como: ‘dormir’, ‘hambre’, ‘gases’, ‘pañal’, ‘cólicos’ o ‘mimos’.

Las etiquetas las estableció ella misma mediante la observación del pequeño. Teniendo en cuenta que, si lo hacía de forma incorrecta, la IA no sería capaz después de identificar los patrones de manera correcta.

Una IA para entender a los bebés

Los diferentes audios de los llantos se convirtieron en espectogramas. Es decir, en representaciones gráficas del espectro de frecuencias sonoras. Su función es mostrar frecuencias altas y modulaciones de amplitud, entre otras cosas. O dicho de otra manera, particularidades que el oído humano, por sí mismo, no es capaz de identificar. De esta forma, el algoritmo podía comenzar a reconocer patrones.

Pero uno de los problemas con los que se ha encontrado Laguna es la necesidad de ampliar su muestra de datos. Su trabajo se basaba en los audios que le proporcionaba su hijo. Ahora, tiene otro bebé. Pero, para poder desarrollar su IA con mayor fiabilidad, necesita contar con muchas más grabaciones, pertenecientes a otros sujetos, no únicamente a dos individuos que son, además, hermanos. Esto podría generar un sesgo que echara abajo su investigación.

Por ejemplo, con su primer bebé, descubrió que, en el etiquetado de los llantos, el 50% de los mismos correspondía a ‘hambre’. Esto puede deberse a que a su hijo le gustase especialmente comer, no a que todos los bebés del mundo actúen de la misma manera.

So Good Data

So Good Data es una ONG para estudiar los llantos del bebé

Así, desde principios de año, ha decidido dar a conocer su trabajo para que otros padres puedan ayudarle en lo que considera una tarea de interés social.

Laguna trabaja con la ONG So Good Data. A través de ella, ha lanzado una campaña de donación para que los padres graben y donen los llantos de sus hijos. El proyecto se llama ‘Traducción de llantos de bebés’. Y además del archivo de audio, los interesados en participar han de aportar estos datos: el motivo del llanto, la nacionalidad de los padres, los meses de vida del bebé y si es niño o niña.

Después de un mes, y gracias a técnicas de future engineering y data aumentation, ha logrado una base de datos de 1.200 audios. La muestra, mucho más versátil, le dice ahora, por ejemplo, que el 24% de los llantos son producidos por el hambre.

El hecho de que se pregunte por la nacionalidad de los padres es bastante importante. Se debe a cuestiones de prosodia. Es una rama de la lingüística que estudia la entonación de las palabras. Según el idioma natal de los padres, la prosodia será diferente en cada individuo. Los pequeños ya comienzan a escuchar (y a desarrollar su futuro lenguaje) cuando se encuentran en el vientre materno.

A Laguna aún le queda un largo camino para conseguir una IA verdaderamente eficaz: usar técnicas de deep learning, transfer learning, clustering… Y conseguir más grabaciones, con bebés de muchas nacionalidades, para hacer su trabajo lo más completo posible y sin sesgo.

Su objetivo no es solo ayudar a padres primerizos, sino que su algoritmo pueda aplicarse a la detección precoz de enfermedades, como el autismo.

Chatterbaby

El proyecto de Ana Laguna no es el primero que se ha interesado por analizar y comprender el llanto de los bebés. Chatterbaby es una app del equipo de la Universidad de California (UCLA), dirigido por la neuropsicóloga computacional Ariana Anderson. La aplicación compara el llanto del bebé del usuario con los que tiene registrados en su base de datos y predice el motivo por el que el bebé está llorando. Según el equipo, la herramienta tiene un 90% de acierto.

Distingue entre tres categorías de llanto: dolor, hambre e inquietud. Los llantos por dolor se han conseguido a través de muestras como el pinchazo de una vacuna o la perforación para poner un pendiente. Las otras dos categorías son más complejas. Esas reacciones son etiquetadas por un grupo de madres veteranas que trabaja con el proyecto y que han aprendido a identificar el motivo de un llanto por propia experiencia. El ‘diagnóstico’ nunca lo da una única madre, sino que debe haber consenso entre ellas.

El equipo de la doctora Anderson trabaja con variables como la fuerza, la duración o las pausas silenciosas durante el llanto. No solo trabaja con llantos, sino también con balbuceos o risas, pues estos también servirán para identificar pautas de comportamiento.

Chatterbaby, disponible en Android e IOs, es un proyecto en evolución. Esperan más muestras (donadas por padres interesados en hacer crecer su proyecto) que les permitan seguir desarrollando su IA. Y así identificar llantos motivados por cólicos, miedo o ansiedad por la separación.

En un primer momento, el objetivo de esta app era ayudar a los padres sordos a interpretar el llanto de sus bebés. Pero, con el tiempo, el equipo espera desarrollar un profundo conocimiento sobre el desarrollo humano en esas edades tan tempranas.

¿Llegaremos alguna vez a tener un auténtico traductor de bebés como el que nos mostraron en ‘Los Simpson?

En Nobbot | TJ Tool, Inteligencia Artificial para un periodismo de mayor calidad

Imágenes | SoGoodData, Photo by Chi?n Ph?m on Unsplash, Photo by Irina Murza on Unsplash

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *