Investigadores desarrollan un modelo climático con inteligencia artificial

Investigadores del Instituto de Física de Cantabria (IFCA), centro mixto del Centro Superior de Investigaciones Científicas (CSIC) y la Universidad de Cantabria, y de la empresa Predictia, han desarrollado un modelo climático con inteligencia artificial capaz de producir datos meteorológicos en directo y en alta resolución, dentro de la iniciativa Code For Earth del Centro Europeo de Meteorología (ECMWF).

Para ello, los responsables han utilizado distintas técnicas de aprendizaje profundo (deep learning), que se utilizan, por ejemplo, en herramientas de inteligencia artificial generativa como ChatGPT o Dall-E, con el objetivo de «producir datos de análisis climáticos de alta resolución a partir de otros datos de una resolución muy baja», explica Mario Santa Cruz, investigador de Predictia.

«Normalmente los datos meteorológicos en directo tienen una resolución muy baja, de unos 25 kilómetros. Por ejemplo, en Cantabria podría suponer que Peñacabarga y Santander tendrían la misma temperatura, lo cual nosotros sabemos que no tiene mucho sentido, por tanto, utilizamos técnicas de inteligencia artificial para producir una rejilla de referencia de mayor resolución«, añade.

El objetivo es mejorar la precisión geográfica para así obtener una información climática mucho más fiel. «Antes teníamos un único valor para Peñacabarga y Santander, ahora podemos separarlo en zonas más pequeñas y asignarles un valor ajustado a las características de cada región en particular», afirma Santa Cruz.

Este análisis climático tan preciso y rápido se podría realizar con modelos físicos, sin embargo, tienen un alto coste computacional comparado con las técnicas que ha implementado el equipo investigador, «en las que, en cuestión de dos segundos, podemos ejecutar los datos de todo un día», explica el investigador.

NUBE DE CIENCIA ABIERTA

El IFCA coordina AI4EOSC, un proyecto europeo dentro de la Nube Europea de Ciencia Abierta (EOSC por sus siglas en inglés, European Open Science Cloud), que tiene como objetivo promover el uso de IA en diferentes disciplinas.

El papel de esta plataforma ha sido indispensable para este proyecto, ya que se han puesto a disposición del equipo investigador todos los recursos computacionales necesarios para llevar a cabo el entrenamiento del modelo climático.

«Nos han permitido usar nodo GPUS, que son computadoras que están especialmente diseñadas para realizar estos procesos, y son muy útiles para ajustar este tipo de modelos, llamados redes neuronales», explica Javier Díez, investigador del Grupo de Clima del IFCA. «De esta manera el ajuste de estas redes se realiza de forma mucho más rápida», afirma.

Para entrenar el modelo de IA se utilizan datos de dos reanálisis, es decir, de un modelo climático que se estudia en el pasado, por ejemplo, un modelo de hace 50 o 60 años, que asimila datos observacionales, como datos de termómetros, o de presión atmosférica, que quedaron registrados.

Estos reanálisis son la mejor representación del clima del pasado que se puede obtener hoy en día, y partir de ellos, se entrenan modelos que ayudan a estudiar cuáles son los patrones climáticos existentes, observando cómo variaba la climatología antaño.

«Seleccionamos en el mapa una región mediterránea y entrenamos dos reanálisis, uno de baja resolución, de datos cada 25 kilómetros y un reanálisis de alta resolución, que tendría datos de cada 0,05 kilómetros, y ajustamos un modelo situado entre esos dos reanálisis, que entiende y aprende cuáles son sus relaciones», detalla el investigador del Grupo de Clima. «Podemos tener una predicción a 0,05 kilómetros sin necesidad de utilizar un modelo dinámico y numérico que tendría un coste computacional enorme«, concluye Díez.

Una de las claves de AI4EOSC es la posibilidad de que la ciencia debe estar a disposición de todo el mundo, sin coste y con total accesibilidad, por ello, tanto el modelo climático entrenado, como su código, están disponibles en la web de la plataforma para que cualquier persona interesada pueda entrenar su propio modelo en la región que elija, y utilizando la infraestructura del proyecto, sin necesidad de hacer uso de su ordenador personal.