Esta IA de Meta es capaz de traducir lo que dices en 100 idiomas diferentes y la puede usar cualquiera

«Hola, creo que el videojuego es cultura y uno de los mejores pasatiempos que existen», explica en castellano un usuario mirando fijo a la cámara de su móvil. Apenas unos segundos después, en pantalla, recibe una copia del vídeo en el que se le puede ver diciendo exactamente lo mismo con una entonación y ritmo más o menos similar, pero en alemán. Esto es algo que cualquiera puede hacer con SeamlessM4T , herramienta de inteligencia artificial (IA) desarrollada por Meta que es capaz de realizar traducciones hasta en 101 idiomas y que, hoy mismo, tras haber pasado la revisión por pares y ser validado científicamente, ha sido presentada en una publicación en la revista ‘ Nature ‘.El sistema, que ya había sido presentado por la empresa en agosto de 2023, tiene como mayor virtud su capacidad para entender idiomas de los que no hay muchos datos en la red, y aquí hay hueco para el suajili, el zulu o para el bable asturiano. Esa falta de información dificulta enormemente el que herramientas de esta clase ofrezcan buenos resultados en la elaboración de traducciones. Sin embargo, parece que SeamlessM4T cumple bien en este apartado. MÁS INFORMACIÓN noticia Si Los investigadores en IA piden amparo a Europa tras la cancelación de 31 millones en ayudas«Yo lo he probado con dialecto austriaco y, aunque comete algún error, lo pilla, te lo traduce hasta con el acento y pareces tú el que lo está diciendo. No está nada mal», explica en conversación con ABC Andreas Kaltenbrunner, investigador líder del grupo AI and Data for Society de la Universidad Oberta de Cataluña. De acuerdo con Kaltenbrunner, la herramienta de Meta, que también es capaz de reducir el sonido de fondo, representa una «gran mejora» en el campo de la traducción mediante el uso de inteligencia artificial. Aunque, evidentemente, también cuenta con sus puntos flacos . A pesar de que la máquina «entiende» hasta 101 idiomas, solo puede traducir directamente la voz del usuario a 36 de ellos . Lo mismo pasa cuando la operación es de texto a voz. Mientras tanto, cuando la operación se realiza de texto a texto se llega hasta los 96 idiomas.Un 20% mejorDe acuerdo con Meta, SeamlessM4T ha demostrado en las pruebas que ofrece un rendimiento un 20% superior al resto de los mejores sistemas anteriores basados en la traducción mediante el empleo de inteligencia artificial. Para poder conseguir estos resultados, el motor del ingenio fue capacitado con un enorme conjunto de datos que contenía 4,5 millones de horas de audio multilingüe procedente de todos los rincones de la red. El equipo de IA de la tecnológica se esforzó para que la máquina fuera capaz de comprender los patrones de los distintos idiomas, y para ello recurrió a fragmentos de audio en un idioma que coincidían con los subtítulos en otro. Lo que realmente interesaba a los investigadores era capacitar su ingenio para que fuese capaz de reconocer cuándo dos contenidos -como podría ser una película con su doblaje por texto correspondiente- coinciden efectivamente en su significado aunque estén en idiomas distintos. Y, a partir de ahí, ser capaz de traducir lo mejor posible las entradas de voz o texto de los potenciales usuarios.Además, a la hora de hacer la traducción, el sistema no usa como puente el inglés entre los distinto idiomas , que era lo habitual hasta el momento. De este modo es capaz, por ejemplo, de pasar de castellano a italiano directamente. «Estamos hablando de un modelo de IA muy potente que supera lo que conocíamos al momento. Abarca muchos idiomas», señala a este diario Pablo Haya Coll, investigador del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid. Con todo, el experto avisa de que la herramienta tiene problemas con nombres propios y coloquialismos y que, sin duda, debido a las diferencias en la cantidad de datos disponibles para el entrenamiento, «funcionará mucho mejor en inglés que en cualquier otro idioma»: «De los idiomas que no tienen corpus paralelos públicos en internet no se darán tan buenos resultados, pero desde luego aquí lo harán mucho mejor que en otros modelos».IA inclusivaAl ser open source, el sistema de Meta a disposición de la comunidad científica para que pueda hacer uso de él y ejecutarlo. Lo único que no se permite es su uso comercial. En opinión de Maite Martín, catedrática del departamento de Informática de la Universidad de Jaén e investigadora del grupo de investigación SINAI, «significa un gran avance que será aprovechado por los investigadores»: «OpenAI, por ejemplo, no te deja usar esta tecnología cuando la desarrollan para emplearla en tus aplicaciones si no pagas. Meta nos lo está dejando disponible para que podamos emplearlo en mejorar nuestros proyectos». Los investigadores detrás del sistema, además, han tenido cuidado para intentar evitar que, en la medida de lo posible, incrementan la toxicidad de los textos o incluyen sesgos de género . Por ejemplo, durante el desarrollo se examinó si el modelo sobrerrepresentaba el masculino o el femenino al traducir frases neutrales, ya que, por ejemplo, ‘I am a teacher’ en inglés se puede traducir al castellano como «Soy profesor» o como «Soy profesora». El objetivo es intentar garantizar que las traducciones sean lo más inclusivas y seguras que sea posible.

Sé el primero en comentar

Dejar una contestacion

Tu dirección de correo electrónico no será publicada.


*