Foto: Bridget Coila from Beijing, China, CC BY-SA 2.0, via Wikimedia Commons

¿Muerte por traducción automática?

El exceso de confianza en las herramientas de traducción automática ha provocado un mal uso por parte de autoridades en situaciones de alto riesgo. La solución pasa por mejorar los sistemas, pero también por educar en su uso.
AÑADIR A FAVORITOS

Imagina que estás en un país extranjero en el que no hablas el idioma y tu hijo pequeño empieza a convulsionar inesperadamente por fiebre. Lo llevas al hospital y los médicos utilizan un traductor en línea para informarte de que tu hijo va a estar bien. Pero “su hijo está teniendo una convulsión” aparece accidentalmente en tu lengua materna como “su hijo está muerto”.

Este ejemplo concreto es una posibilidad muy real, según un estudio de 2014 publicado en el British Medical Journal acerca de la limitada utilidad de la traducción automática asistida con inteligencia artificial en las comunicaciones entre pacientes y médicos. 

Las herramientas de traducción automática, como Google Translate, pueden ser muy útiles, y las grandes empresas tecnológicas suelen promocionarlas como herramientas precisas y accesibles que romperán muchas barreras intralingüísticas en el mundo moderno. Sin embargo, la realidad es que las cosas también pueden salir muy mal. Según los expertos, la confianza injustificada en la capacidad de estas herramientas de traducción automática ya está provocando un mal uso por parte de las autoridades en situaciones de alto riesgo: pedir un café en un país extranjero o traducir la letra de una canción no puede hacer mucho daño, pero pensemos en situaciones de emergencia en las que intervienen los bomberos, la policía, la patrulla fronteriza o inmigración. Sin una regulación adecuada y directrices claras, la situación podría empeorar.

Los sistemas de traducción automática como Google Translate, Microsoft Translator y los integrados en plataformas como Skype y Twitter son algunas de las funciones más difíciles en el procesamiento de datos. La preparación de un gran modelo puede producir tanto CO2 como un vuelo transatlántico. Para su desarrollo, se alimenta un algoritmo o una combinación de algoritmos con un conjunto de datos específicos de traducciones. Los algoritmos guardan las palabras y sus posiciones relativas como probabilidades de que puedan aparecer juntas, creando una estimación estadística de lo que podrían ser otras traducciones de frases similares. El sistema algorítmico, por tanto, no interpreta el significado, el contexto y la intención de las palabras, como haría un traductor humano. Se trata de una conjetura que no es necesariamente exacta.

En Corea del Sur, un joven usó una aplicación de traducción de chino a coreano para decirle al esposo coreano de su compañera de trabajo que deberían volver a pasar el rato juntos pronto. Una mala traducción resultó en que se refiriera erróneamente a la mujer como trabajadora de un establecimiento de vida nocturna, lo que resultó en una violenta pelea a puñetazos entre los dos en la que el esposo fue asesinado, según informó el Korea Herald en mayo.

En Israel, un joven subtituló una foto de sí mismo apoyado en una excavadora con la leyenda árabe “يصبحهم”, o “buenos días”, pero la traducción de IA de las redes sociales lo tradujo como “lastímalos” en inglés o “atácalos” en hebreo. De acuerdo con The Guardian, esto llevó al hombre, un trabajador de la construcción, a ser arrestado e interrogado por la policía en octubre de 2017.

Algo similar sucedió en Dinamarca en septiembre de 2012. Según informó el Copenhagen Post Online, la policía se enfrentó erróneamente a un hombre kurdo por supuestamente financiar el terrorismo debido a un mensaje de texto mal traducido. En 2017, un policía en Kansas usó Google Translate para preguntarle a un hispanohablante si podían buscar drogas en su automóvil. Sin embargo, la traducción era inexacta y el conductor no entendía completamente lo que había consentido dada la falta de precisión en la traducción. El caso fue desechado en la corte, según documentos legales estatales.

Estos ejemplos no son tan sorprendentes. La precisión de una traducción puede variar ampliamente dentro de un solo idioma –de acuerdo con factores de complejidad del lenguaje como la sintaxis, la longitud de la oración o el dominio técnico– así como entre idiomas y combinaciones lingüísticas, dependiendo de qué tan bien se hayan desarrollado y entrenado los modelos. Un estudio de 2019 mostró que, en entornos médicos, las instrucciones de alta hospitalaria traducidas con Google Translate al español y al chino están mejorando con los años, con una precisión general de entre 81 y 92 por ciento. Sin embargo, el estudio también encontró que hasta el 8 por ciento de las traducciones erróneas tienen el potencial de causar un daño significativo. Una evaluación pragmática de Google Translate para instrucciones giradas en el área de urgencias a partir de 2021 mostró que el significado general se mantuvo para el 82.5 por ciento de las 400 traducciones que usan español, armenio, chino, tagalo, coreano y farsi. Pero aunque las traducciones en español y tagalo son precisas, más del 90 por ciento de las veces hay un 45 por ciento de posibilidades de que se equivoquen cuando se trata de idiomas como el armenio. No todos los errores en la traducción automática son de la misma gravedad, pero las evaluaciones de calidad siempre encuentran algunos errores críticos de precisión, de acuerdo con este informe de junio.

La buena noticia es que las grandes empresas de tecnología son plenamente conscientes de esto, y sus algoritmos están mejorando constantemente. Año tras año, sus puntajes BLEU, que miden qué tan similar es el texto automáticamente traducido a una gran variedad de traducciones humanas de alta calidad, mejoran constantemente. Recientemente, Microsoft reemplazó algunos de sus sistemas de traducción con una categoría más eficiente de modelo de inteligencia artificial. Los programas de software también se actualizan para incluir más idiomas, como aquellos que a menudo se describen como “lenguajes de bajos recursos” porque son menos comunes o más difíciles de trabajar. Eso incluye la mayoría de los idiomas no europeos, pero también a otros ampliamente utilizados como el chino, el japonés y el árabe, o los pequeños idiomas comunitarios, como el sardo y el pitkern. Por ejemplo, Google ha estado construyendo un práctico sistema de traducción automática para más de mil idiomas. Meta acaba de lanzar el proyecto No Language Left Behind, que intenta implementar traducciones de alta calidad directamente entre 200 idiomas, incluidos idiomas como el asturiano, el luganda y el urdu, acompañado de datos sobre cómo mejoraron las traducciones en general.

Sin embargo, los errores que conducen a malentendidos, como los experimentados por el trabajador de la construcción, tienden a ser aleatorios, subjetivos y diferentes para cada plataforma y cada idioma. Por lo tanto, catalogarlos es solo superficialmente útil para descubrir cómo mejorar la traducción automática, dice Félix Do Carmo, profesor titular del Centro de Estudios de Traducción de la Universidad de Surrey. De lo que tenemos que hablar en su lugar, dice, es de “¿cómo se integran estas herramientas en la sociedad?” Lo más importante es que tenemos que ser realistas sobre lo que la traducción automática puede y no puede hacer por las personas en este momento. Esto implica comprender el papel que esta tecnología puede tener en la vida cotidiana, cuándo y dónde se puede usar, y cómo es percibida por las personas que la usan. “Hemos visto discusiones sobre errores en cada generación de traducción automática. Siempre existe la expectativa de que mejorará”, afirma Do Carmo. “Tenemos que encontrar soluciones que se acoplen a los problemas humanos”.

Y eso significa comprender el papel que los traductores humanos aún deben desempeñar. A pesar de que los medicamentos han mejorado enormemente a lo largo de las décadas, todavía existe la necesidad de que un médico los recete. Del mismo modo, en muchos de los casos en que se utilizan traducciones, no hay necesidad de eliminar totalmente a los mediadores humanos, dice Sabine Braun, directora del Centro de Estudios de Traducción de la Universidad de Surrey. Una forma de aprovechar la tecnología cada vez más sofisticada y a la vez protegerse contra los errores se puede lograr mediante la traducción automática seguida de la post edición, o MT+PE, por sus siglas en inglés, en la que un humano revisa y refina la traducción.

Uno de los ejemplos más antiguos de una empresa que utiliza MT+PE con éxito se detalla en este estudio de 2012 sobre Autodesk, una compañía de software que proporciona servicios de imágenes para arquitectos e ingenieros, que utilizó la postedición para la traducción automática de su interfaz de usuario a 12 idiomas. Otras soluciones similares han sido reportadas por la consultora EY, por ejemplo, y el banco suizo MigrosBank, que descubrió que la post edición aumentó la productividad de la traducción hasta en un 60 por ciento, según Slator. Algunas empresas de traducción automática ya han dejado de vender sus tecnologías para el uso directo de los clientes y ahora siempre requieren algún tipo de traducción posterior a la edición, dice Do Carmo. Por ejemplo, Unbabel y Kantan son plataformas complementarias que las empresas agregan a sus flujos de trabajo de atención al cliente y marketing para llegar a clientes de todo el mundo. Cuando detectan mala calidad en los textos traducidos, los textos se enrutan automáticamente a editores profesionales. Aunque estos sistemas no son perfectos, aprender de ellos podría ser un comienzo.

En última instancia, Braun y Do Carmo piensan que es necesario desarrollar marcos holísticos que vayan mucho más allá de las métricas utilizadas en este momento para valorar o evaluar la calidad de la traducción, como BLEU. Afirman que les gustaría ver al sector trabajando en un sistema de evaluación que abarque también el por qué del uso de la traducción. Un enfoque podría ser un organismo regulador internacional independiente para supervisar el uso y desarrollo de la traducción automática en el mundo real, con muchos científicos sociales a bordo. Ya hay muchos estándares en la industria de la traducción, así como organismos de estandarización tecnológica, como la organización W3, por lo que los expertos creen que se puede hacer, siempre y cuando haya algo más de organización en la industria.

Tanto los gobiernos como las empresas privadas también necesitan políticas claras sobre exactamente cuándo los funcionarios deben y no deben usar herramientas de traducción automática, ya sean gratuitas y dirigidas al consumidor o de otro tipo. Neil Coulson es el fundador de CommSOFT, una empresa de tecnología de software de comunicación y lenguaje que intenta hacer que la traducción automática sea más segura. “A las fuerzas policiales, las agencias de control fronterizo y muchas otras organizaciones oficiales no se les dice que la traducción automática no es una traducción exacta, por lo que prueban estos dispositivos de consumo”, dice. En marzo de 2020, su organización envió una solicitud de transparencia  a 68 grandes organizaciones diferentes del sector público del Reino Unido solicitando sus políticas sobre el uso de tecnologías de traducción de dispositivos de consumo. El resultado: ninguna de estas organizaciones tenía una política para el uso de traducción automática, y no monitorean su uso ad hoc por parte de su personal. Esto puede conducir a un panorama no regulado en el que cualquiera puede publicar una aplicación de traducción y afirmar que funciona, dice Coulson. “Es un enfoque de ‘deja que florezcan mil flores’ … pero eventualmente alguien come una flor que resulta ser venenosa y muere”, dice Coulson.

Por supuesto, la educación sobre los pros y los contras de la traducción automática es primordial entre los investigadores, las empresas y las organizaciones que desean comenzar a usar la herramienta, pero sobre todo, entre los usuarios cotidianos. Es por eso que Lynne Bowker, profesora de traducción e interpretación en la Universidad de Ottawa, comenzó el proyecto de Alfabetización en Traducción Automática. Su objetivo es difundir la conciencia de cómo los sistemas de este tipo procesan la información y enseñar a los investigadores y académicos a usar la traducción automática de manera más efectiva.

También sería útil incluir información sobre la traducción automática como parte de la alfabetización digital e informática impartida en las escuelas. “Ser alfabetizado en traducción automática significa comprender lo esencial de cómo funciona esta tecnología para poder evaluar sus fortalezas y debilidades para una tarea o uso en particular”, dice Bowker. El lenguaje, en un contexto social, es comunicación. “Uno de los verdaderos desafíos a los que nos enfrentamos es cómo llegar al público en general con este mensaje”, dice Bowker.

Ser capaz de diferenciar entre tareas de bajo riesgo y tareas de alto riesgo sigue siendo uno de los puntos clave, dice Bowker. Por suerte, mientras eso ocurre, la mayoría de las traducciones erróneas aún conducen solamente a situaciones de comedia: según un estudio de 2016 en el International Journal of Communication, hay un restaurante chino llamado Translate Server Error. El sistema de traducción automática tradujo mal el idioma original, pero los dueños del restaurante no sabían inglés lo suficientemente bien como para darse cuenta del error.

Este artículo es publicado gracias a una colaboración de Letras Libres con Future Tense, un proyecto de SlateNew America, y Arizona State University.


    ×  

    Selecciona el país o región donde quieres recibir tu revista: