Las redes neuronales transforman la profesión de traductor

Las redes neuronales transforman la profesión del traductor

TraductorA pesar de la globalización económica y cultural, el mundo de hoy sigue siendo una Torre de Babel. Más de 7.000 lenguas se hablan en todo el planeta. En este contexto, la traducción es y seguirá siendo una actividad imprescindible para poner un poco de orden en este caos. Ahora, además, las redes neuronales están a punto de transformar definitivamente la profesión del traductor.

La industria de la traducción a nivel mundial movió, según la consultora Common Sense Advisory, algo más de 46.500 millones de dólares en 2018. Y se calcula que para 2021 esa cifra sobrepasará los 56.000 millones de dólares. Sin embargo, la tecnología está cambiando de raíz una profesión históricamente artesanal e intuitiva. 

Hasta hace poco los sistemas de traducción eran desarrollados por ingenieros informáticos y lingüistas que escribían programas, reglas y diccionarios de forma manual. Sin embargo, como nos explica Antoni Oliver, director del Máster universitario online de traducción y tecnologías de la UOC, “en las metodologías más recientes, como la estadística y la neuronal, los sistemas se entrenan. Es decir, son capaces de aprender a traducir si les proporcionamos grandes cantidades de textos originales y traducidos”.

Modelo estadístico vs. neuronal

traductor de idiomas

Pero antes de seguir conviene diferenciar el modelo estadístico del neuronal. Los sistemas estadísticos se basan en cálculos de probabilidades. Por ejemplo, funcionan calculando las probabilidades de que una palabra o conjunto de palabras de la lengua a la que se traduce el texto venga de una misma palabra o conjunto de palabras en la lengua de partida. En estos sistemas, un programa llamado decoder es el encargado de encontrar una traducción muy probable de la lengua de partida a la lengua de llegada.

En cambio, los sistemas de traducción automática neuronal se basan en la utilización de redes que están compuestas por miles de unidades artificiales cuyo comportamiento se asemeja a las neuronas, pues su activación depende del estímulo que reciben unas de otras. La traducción se genera por asociación, y no por cálculo estadístico. La idea matemática y computacional detrás de los sistemas neuronales se remonta a mediados del siglo XX, pero solo hace unos pocos años se ha podido aplicar a la resolución de problemas reales como la traducción. 

Entrenamiento con millones de oraciones

En todo caso, al igual que la traducción automática estadística, los sistemas de traducción neuronal se entrenan o aprenden a partir de grandes corpus paralelos. Es decir, conjuntos de oraciones en una determinada lengua junto con su traducción a otro idioma. La diferencia es que los corpus de los sistemas neuronales deben ser mucho mayores. 

En la UOC, por ejemplo, han entrenado un sistema neuronal sencillo de traducción del inglés al español con unos nueve millones de oraciones inglesas y sus correspondencias en español. Por su parte, para entrenamiento de un sistema chino-español han usado un total de 7,94 millones de oraciones chinas con sus correspondientes paralelismos en español.

La traducción neuronal es el sistema que usan Google Translate, Microsoft Translator o Yandex, el buscador de referencia en Rusia. Antoni Oliver asegura que es mucho más fiable que su predecesora, la estadística, aunque reconoce que no es infalible: “Para muchos pares de lenguas, los resultados de la traducción automática neuronal son totalmente correctos en un porcentaje elevado de oraciones, pero en un determinado porcentaje produce errores importantes, y, lo que es más grave, errores difíciles de detectar a primera vista”.

Textos muy fluidos, pero con algunos errores

La complicación está en que este tipo de traducción da como resultado textos muy fluidos construidos con oraciones que suenan bien en la lengua de llegada, pero que en algunos casos no son correctas. Eso exige, pues, un trabajo de posedición por parte de un traductor que le requerirá prestar mucha atención. Probablemente para realizar pocos cambios, pero estos serán cruciales en algunos casos para darle el sentido adecuado a la frase.

“Si se mide el trabajo del traductor profesional por el número de cambios requeridos, quizás sea poco, pero si se mide por el tiempo necesario y la atención requerida, entonces la cantidad de trabajo es importante”, asegura Antoni Oliver.

De todas maneras, la utilización de sistemas de traducción automática neuronal agilizará el trabajo del traductor humano. Es decir, un profesional que edite las propuestas automáticas que le da el sistema irá más rápido que si trabaja directamente el texto desde cero. Además, Oliver no cree que la tecnología vaya a acabar con el oficio de traductor, puesto que el volumen de textos a traducir va al alza. Eso sí, el experto deberá ser receptivo y adaptarse a los cambios. Cada vez deberá ser más eficiente. 

Cómo acceder a sistemas neuronales

Red neuronalCualquier empresa o traductor autónomo puede tener acceso a esta tecnología con una inversión mínima. De hecho, los principales toolkits para el entrenamiento de sistemas neuronales y su posterior uso son de software libre. Es decir, además de ser gratuitos, son de código abierto y se pueden utilizar y modificar sin restricciones.

El problema es que exigen unos conocimientos informáticos algo avanzados. Además, requieren disponer de ordenadores dotados con unidades de procesamiento gráfico (GPU) potentes

Muchos sistemas de traducción automática gratuita, como Google Translate, ya utilizan sistemas neuronales en muchos pares de lenguas. Para un uso intensivo profesional, mediante una API, se pueden contratar suscripciones a diversos sistemas, como los de Google, Microsoft o DeepL. Estos accesos suelen facturarse por caracteres, pero son realmente económicos. 

En la UOC están trabajando en el proyecto Mtuoc de distribución de sistemas neuronales genéricos gratuitos. La universidad online también colabora con ONGs para el entrenamiento de sistemas adaptados a sus necesidades y ofrece colaboración con empresas e instituciones para el entrenamiento y puesta en marcha de sistemas neuronales adaptados. 

En Nobbot | En busca de una nueva definición para la inteligencia de las máquinas

Imágenes | iStock.com/BulatSilvia / Cybrain / Spectral-Design

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *