La RAE arranca la segunda fase de su proyecto de IA (LEIA)

La Real Academia Española (RAE) ha iniciado la segunda fase del proyecto LEIA (Lengua Española e Inteligencia Artificial) con la que se crearán un observatorio de neologismos, un verificador lingüístico y una herramienta para dar respuesta a dudas lingüísticas gracias al entrenamiento de la inteligencia artificial (IA) a través de materiales y obras en los que la RAE ha trabajado.

«Hay gente que piensa que si no estamos metiéndonos en un terreno que no forma parte de la actividad ordinaria de la Academia. Y tienen razón. Esto no forma parte de la actividad tradicional de la Academia, pero esto es la tecnología. Y la tecnología no hay quien la pare«, ha asegurado el director de la RAE, Santiago Muñoz Machado, en un encuentro con los medios.

Las aplicaciones resultantes de esta segunda fase de LEIA, que cuenta con 5 millones de euros, estarán disponibles de manera gratuita en una plataforma a través de la página web de la RAE a mediados del próximo 2025, según ha informado la entidad, con el objetivo de la «defensa, proyección y buen uso del español en el universo digital» y, especialmente, de la IA, ha explicado la experta en la materia, Asunción Gómez-Pérez, este jueves 14 de marzo.

HERRAMIENTAS DE USO LIBRE Y GRATUITA

Así, dos de las herramientas prioritarias para la RAE son el observatorio de neologismos, términos y variaciones del español, que consistirá en una aplicación que detecte -a partir de fuentes como prensa, blogs, información en redes sociales y demás obras de la Academia- palabras y expresiones panhispánicas en uso que no se hayan registrado en el Diccionario de la lengua española (DLE).

Aunque los equipos lingüísticos de la RAE tendrán «más justificaciones» para incluir palabras en el diccionario anual, Muñoz Machado ha asegurado que los tiempos que se emplean en el proceso «no cambiarán necesariamente».

«Las entradas que tenemos en información serán mucho más rápidas y mucho más insistentes. Y la presentación final de las modificaciones que hacemos cada año, pues podrán estar también mucho más motivadas», ha asegurado el director, mientras que ha explicado que en la plataforma se podrán ver estas palabras o expresiones.

Otra de las herramientas prioritarias para la entidad es el verificador lingüístico, con el que los usuarios podrán comprobar, tras introducir su texto, si este es correcto desde un punto de vista ortográfico, gramatical y léxico, mientras que la aplicación ofrecerá sugerencias de cambio y explicaciones sobre el error realizado.

Según ha puntualizado Asunción Gómez-Pérez, este recurso estará en constante perfeccionamiento gracias al uso de «hackathons», que pondrán a prueba su funcionamiento, para que, tanto el público general como el especializado, puedan hacer uso del verificador.

Por otra parte, la RAE también pondrá en funcionamiento una herramienta que de respuesta a las dudas lingüísticas de los hispanohablantes a través de un buscador y un el sistema que seleccionará la respuesta de entre las almacenadas en la plataforma. Como ha explicado Gómez-Pérez, en caso de que el sistema no pueda dar respuesta concluyente, el usuario recibirá la explicación de manera «personalizada» de los lingüistas de la RAE.

Junto con todas estas herramientas, que contarán con la implementación de medidas para la accesibilidad, existirá una línea de recopilación de material las distintas variedades geográficas del español (especialmente léxico y oral), que se completa con las aportaciones de los hispanohablantes, quienes podrán ver una imagen y describirla con su propia voz, u observar un objeto e indicar cómo lo llaman en su lugar de procedencia y así crear un «corpus oral» que entrene a la IA.

Todos los materiales generados por LEIA, se pondrán a disposición pública para contribuir a «impulsar la industria de Tecnologías del Lenguaje en español, como se anunció en el Real Decreto 632/2022, de 26 de julio de 2022.

Finalmente, para la ejecución de los paquetes de trabajo, la RAE ha puesto a «todo» su personal interno a disposición de esta segunda fase, mientras que contará con la participación de las empresas externas subcontratadas Fujitsu, con tecnología de Amazon Web Services (AWS), para los paquetes correspondientes al observatorio, verificador, diversidad y accesibilidad, y VASS, para la elaboración de la herramienta de consultas y respuestas.