Metaclip: cómo hacer un seguimiento del viaje que sigue el dato climático #PredictiaPapers

Miércoles, November 25, 2020

Desde que se siembra hasta que llega a nuestra mesa en forma de pan, el trigo sufre muchas transformaciones. Lo mismo le pasa a los datos climaicos y meteorológicos. Desde que se toman los datos a través de satélites y sensores, o se calculan modelos climáticos en super-ordenadores, hasta que llegan al usuario final, los datos y predicciones cambian mucho.. De la misma forma que sabemos que la comida de nuestro frigorífico es comestible y segura gracias a los protocoloes de seguridad alimentaria, la calidad de los datos climáticos debe garantizarse de alguna manera. Sin embargo, no es una tarea sencilla. Los conjuntos de datos climáticos y meteorológicos son enormes, y contienen miles de mediciones para diferentes variables. Todas ellas son validadas, modificadas y recalculadas, empleando diferentes algoritmos. Por eso, en este post queremos hablar de METACLIP, una herramienta que desarrollamos junto con el grupo de meteorología de la Universidad de Cantabria, que permite a los usuarios evaluar la calidad, fiabilidad e integridad de los datos climáticos que emplean, al permitirles seguir todo su viaje. Es lo que los expertos denominan procedencia del dato.

Si quieres leer el artículo revisa por pares sobre METACLIP, está disponible en inglés en el siguiente enlace: "The METACLIP semantic provenance framework for climate products"

Representación espacial del RPSS

Antes de meternos en más detalle, queremos que experimentes METACLIP de primera mano. Para ello, descarga el mapa de arriba, entra en metaclip.com, y arrastra la imagen en la web.. Deberías de poder ver algo parecido a la gráfica interactiva de debajo. Contiene información útil como: los organismos involucrados en generar los datos, los procesos que ha seguido y cuáles son las relaciones entre ellos. Incluso contiene el método de interpolación empleado para tratar los datos.

Gráfica interactiva mostrada por METACLIP

A la hora de desarrollar METACLIP no empezamos desde cero. El ámbito climático no es el único sector donde la procedencia del dato es relevante—mantener un registro de las personas, instituciones y actividades involucradas en el viaje que ha tenido el dato. Logística, manufacturas, gas y petróleo, industria 4.0... El auge del Internet de las Cosas ha puesto a disposición de muchos usuarios una cantidad ingente de datos, cuya calidad y fiabilidad necesita ser analizada y asegurada. Esta es una de las razones por las que el World Wide Web Consortium, la organización internacional que define los estándares para la web, estableció el Resource Description Framework (RDF). Se trata de un modelo estándar para el interccambio de datos en la web. METACLIP se basa en RDF, y proporciona una descripción semántica para los productos climáticos (mapas, gráficas y bases de datos). En concreto, ofrece vocabularios para

  • Datasource: describes the origin of the input data and the transformations the data has gone thtough, such as subsetting, aggregation, anomalies, PCA or climate indices. It also establishes the links between the different transformation commands and arguments in each step.
  • Calibration: encodes the metadata describing the statistical adjustments applied to the climate data: the bias adjustment you can apply through Climadjust; downscaling techniques; or other methods such as variance inflation or ensemble recalibration. The calibration vocabulary follows the framework designed by VALUE, a COST Action European initiative to systematically validate and improve downscaling methods in climate research.
  • Verification: establishes the the metadata related with the verification of seasonal forecast products, describing the verification measures applied, as well as describing the the verification aspect that each measure addresses.In addition, this vocabulary also provides a conceptual scheme to define other forms of climate validation.
  • Graphical: this aims at decribing graphical product, like charts and maps, including a characterization of uncertainty types and how they are communicated.

METACLIP includes previously existing ontologies and schemas, like the Element Set from Dublin Core Metadata Initiative, GeoSPARQL or the PROV Ontology. METACLIP is on constant development. In the end, our hope is to establish a standard metadata for climate products. This would guarantee that, just as we know that we can eat safely thanks to the food safety protocols, we have a realiable climate data diet. Because it’s in our best interest to be as fit as possible in the fight against climate change.