El Gobierno impulsa el uso igualitario de las lenguas oficiales en la IA con una inversión de 7,5 millones

El Gobierno impulsa el uso igualitario de las lenguas oficiales en la IA con una inversión de 7,5 millones

Hace apenas unos meses, el presidente del Gobierno, Pedro Sánchez, presentó en sociedad a ALIA, la nueva inteligencia artificial desarrollada con sello público. Era solo una primera versión, una herramienta en pañales con funciones básicas como generar texto, pero sin capacidad de conversación. Ahora, esa IA estatal ha comenzado a dar sus primeros pasos hacia un objetivo ambicioso: comprender y expresarse en todas las lenguas oficiales del país en igualdad de condiciones.

Para lograrlo, el Gobierno ha destinado una inversión inicial de 7,5 millones de euros. El reto es tan técnico como simbólico: que el gallego, el catalán, el euskera y el valenciano estén tan presentes y funcionen tan bien como el castellano en este sistema de inteligencia artificial. Sin embargo, el camino no está exento de desafíos. Hoy por hoy, reconocen desde el Ministerio para la Transformación Digital, existe un claro «desequilibrio»: el volumen de datos disponibles para entrenar modelos en estas lenguas cooficiales es menor, lo que se traduce en un rendimiento desigual.

Para empezar a corregirlo, el Gobierno ha distribuido los fondos entre centros con experiencia en tecnología del lenguaje. El Barcelona Supercomputing Center coordina el proyecto y ha recibido 3 millones. A la Universidad del País Vasco y a la de Santiago de Compostela se les han asignado 2 millones a cada una, mientras que la Universidad de Alicante ha recibido medio millón. Todas ellas trabajan ya en recopilar y construir los llamados «corpus lingüísticos» en sus respectivos territorios, es decir, grandes conjuntos de datos con los que entrenar a ALIA.

Proyectos como AINA en Cataluña, GAITU en el País Vasco, NÓS en Galicia y VIVES en la Comunidad Valenciana sirven de base para este trabajo. Además, el proceso cuenta con la colaboración de empresas privadas que ayudan a mejorar y adaptar los modelos lingüísticos para distintas aplicaciones.

Esta inversión forma parte del Plan de Recuperación, Transformación y Resiliencia (PRTR), que también ha permitido al BSC recibir otros 12,4 millones adicionales entre 2023 y 2024.

De aquí a 2026, se prevé que ALIA vaya ganando capacidades. Las siguientes versiones deberían poder mantener conversaciones, responder preguntas con respeto y precisión, y ofrecer una experiencia fluida en todas las lenguas oficiales. La clave será seguir alimentando al sistema con datos representativos y de calidad, para que ninguna lengua quede atrás en esta revolución digital.