fbpx
Jueves, Agosto 06, 2020

LA RADIO QUE SE VE, SE SIENTE Y SE ESCUCHA

Stereo Romance - Tecnología y Salud

El ingeniero que te permite hablar más de 100 idiomas

Aprender un idioma cuesta. Esfuerzo, tiempo y, en ocasiones, también dinero. Pero en pleno siglo XXI no siempre es necesario estudiar una lengua para poder comunicarse en cualquier parte del mundo. Basta con sacar el móvil del bolsillo, abrir un traductor y escribir o dictar una frase Inmediatamente después, como por arte de magia, el smartphone la traduce a casi cualquier idioma. El traductor más popular es el de Google, que cada día es utilizado por millones de usuarios en todo el mundo y es capaz de traducir mas de 100 idiomas .Pero detrás de esa magia que parece tener lugar dentro del terminal hay truco y se llama inteligencia artificial.

Para Macduff Hughes, director de ingeniería de Google Translate, el gran cambio en el modo en el que se realizan las traducciones se produjo en 2016. Fue entonces cuando Google incorporó un sistema de traducción automática neuronal: "El antiguo método de traducción funcionaba frase por frase y palabra por palabra mientras que el nuevo coge la oración completa". “Este nuevo sistema es, paradójicamente, mucho más simple, ya que el anterior tenía en cuenta muchas reglas sobre cómo unir frases y reordenar las palabras”, explica Hughes, que no concreta el número de empleados que trabajan en su equipo

Google Translate utiliza patrones de millones de traducciones existentes en la web para ayudar a decidir la mejor traducción. La cantidad de traducciones con la que ha sido entrenada la red neuronal condiciona la calidad de la traducción: “Cuantos más datos tenemos, mejor es la traducción". Por lo tanto, cuando se decide añadir un idioma al traductor, el primer paso es asegurarse de que existe en la web un conjunto de datos fiables para entrenar al sistema.

"Nos tenemos que preguntar si hay suficientes datos para crear un modelo que cumpla con nuestros estándares de calidad. Si lo hay, normalmente podemos desarrollarlo en pocos meses”, explica. Cuando dos idiomas son muy diferentes entre sí, se precisa una cantidad mayor de datos. Por ejemplo, gramaticalmente el inglés es muy diferente del chino y el japonés, por lo que se necesita una mayor cantidad de información para obtener la misma calidad que al hacer una misma traducción del inglés al español.

Para garantizar que el conjunto de datos con el que se entrena el sistema sea de buena calidad, Google cuenta con lectores humanos. Aunque Hughes advierte: "La calidad es importante, pero la cantidad siempre gana a largo plazo". Mientras que la Unión Europea “ha hecho un trabajo maravilloso al proporcionar al mundo traducciones porque muchos documentos tienen que ser traducidos por ley a otros idiomas”, no todas las lenguas cuentan con la misma suerte. Existe, según reconoce Hughes, "un desequilibrio entre los idiomas representados en el traductor y la cantidad de hablantes que hay en el mundo".

"Nos tenemos que preguntar si hay suficientes datos para crear un modelo que cumpla con nuestros estándares de calidad. Si lo hay, normalmente podemos desarrollarlo en pocos meses”

Además de la calidad y la cantidad, también es importante que los sitios web traducidos traten de una amplia gama de temáticas. “Los sitios webs de viajes tienen muchas traducciones y nos volvemos muy buenos traduciendo cosas sobre viajes, pero no tanto cuando por ejemplo se trata de botánica", explica Hughes en un evento en Zúrich sobre inteligencia artificial al que EL PAÍS ha sido invitado por Google. A esto se suma que la mayoría de traducciones disponibles en la web están realizadas en un contexto profesional. El registro utilizado, por lo tanto, difiere de la forma en la que los usuarios hablan realmente en su día a día.

Sesgos y errores de traducción

Cuando las traducciones no son precisas, algunos usuarios alertan a Google a través de mensajes o en redes sociales. Los trabajadores también pueden reportar rápidamente cualquier error. “No arreglamos cada traducción incorrecta porque nos gusta ser lo más estrictamente algorítmicos posible y dejar que el modelo haga su trabajo, pero a veces sí lo hacemos cuando una traducción es ofensiva o engañosa y puede causar algún tipo de daño”, explica.

Información:El  Pais