Cómo desarrollar mapas de uso de suelo de forma eficiente con Deep Learning

Martes, Marzo 2, 2021

Supervisar terrenos cultivados, a qué se dedican y cómo evolucionan a lo largo del tiempo. Analizar el crecimiento y la sostenibilidad de bosques y áreas urbanas, para planificar y mejorar su gestión. O legislar la estartegia agrícola de regiones enteras. Estas son algunas de las facetas de nuestro entorno en la que la gestión del suelo está presente. Y su ejecución depende de una miríada de instituciones: administraciones públicas, gobiernos regionales y nacionales, y plataformas sociales. Sus decisiones impactan durante décadas regiones enteras, por lo que la monitorización del uso del suelo es un campo en continua renovación, para ofrecer nuevas herramientas e información que mejoren la gestión del uso del suelo. Para ello, los mapas de uso de suelo y de cubierta vegetal son una de las principales herramientas. Mapas detallados y de alta resolución que clasifican las localizaciones dependiendo del tipo de suelo, la vegetación que la cubre, el hábitat que presentan, o el la actividad humana a la que están dedicadas. Desarrollar estos mapas es un proceso altamente costoso en tiempo, recursos y dinero. Su ejecución implica habitualmente campañas de trabajo de campo y el uso de tecnologías —como los vuelos LiDAR— y cubren sólamente una porción del territorio. Por eso, desde Predictia hemos desarrollado una Red Neuronal Profunda (Deep Neural Network en inglés) para generar mapas de vegetación precisos. Para ello empleamos la información que nos proporciona Copernicus. Para mostrar esta tecnología en acción, hemos puesto la red neural a trabajar en un mapa de vegetación de Cantabria, , en colaboración con IHCantabria. Para saber más detalles, sigue leyendo.

¿Quieres ver el mapa interactivo? Puedes explorarlo a través de nuestro Showcase!

La evolución de los mapas de uso de suelo: del trabajo de campo y los vuelos a la imagen por satélite y la automatización

On the left, a land use map from Scotland from 1930s. On the right, the same region on a land use map of 2015.
A lo largo de la historia el aspecto de los mapas no ha cambiado mucho, pero han ganado en detalle y usabilidad.  Esta herramienta de la Biblioteca Nacional de Escocia permite comparar dos mapas de uso de suelo de 1930 y 2015.

Mapas indicando el tipo de suelo, los recursos naturales, uso de suelo urbano... Históricamente, este tipo de mapas han sido una herramienta valios, pero con un alto coste. Su elaboración involucra la mobilización de campañas con equipos de expertos (geógrafos, geólogos, botánicos y otros especialistas). A medida que se mejoraron las técnicas por imagen y empezó la automatización, se redujeron los costes. Gracias a tecnologías como los vuelos LiDAR—que emplea sensores láser a bordo de un avión para elaborar mapas de altura— permitieron automatizar parte del proceso. Sin embargo, al coste inicial de elborar estos mapas, mantenerlos actualizados tiene también un coste alto. Esto limita las posibilidades de actualización de los mapas, por lo que se suelen actualizar cada cinco años. 
La revolución en este campo vino de la mano de las constelaciones de satélites, como el programa  europeo Copernicus. Estos satélites proporcionan una ingente cantidad de información a la que puede accederse de forma gratuita en muchos casos. En nuestro caso, para desarrollar el mpaa de vegetación de Cantabria, optamos por obtener la información de los satélites Sentinel 2A y 2B. Ambos tienen una alta frecuencia a la hora de visitar el mismo sitio dos veces: para el Ecuador un satélite pasa por encima cada 10 días (por lo tanto cada 5 días tenemos una imagen nueva de cada uno de los dos satélites). En latitudes medias, como es el caso de Cantabria, el tiempo de espera se reduce a 2 o 3 días.

Aunque estos satélites proporcionan muchos datos brutos, estos datos necesitan ser calisifcados, organizados y analizados para proporcionar una herramienta útil: el mapa de uso de suelo. Y aquí es donde entra en juego la Red Neuronal Profunda.

Inteligencia Artifical para desarrollar un mapa de vegetación

Desde el IHCantabria nos llamaron con un reto muy claro: desarrollar un mapa de vegetación que cubriese toda Cantabria. El objetivo era crear un producto que fuerse útil para la monitorización ambiental y que permitiese a las administraciones públicas gestionar el territorio. Este mapa debía seguir la clasificación EUNIS para hábitats: un conjunto de categorías bien definidas que permite a los ecólogos identificar hábitats en toda Europa de manera única.

A la hora de obtener los datos hemos recurrido los Sentinel-2. Concretamente al instrumento MSI que llevan a bordo. Estos sensores proporcionan grandes cantidades de datos, en 12 bandas espectrales diferentes que cubren desde los canales RGB habituales de la imagen óptica, a varias bandas infrarrojas. Algunas de estas bandas proporcionan señales específicas, directamente relacionadas con la vegetación. Como el NDVI: una medida el estado de salud de la vegetación, que se basa en cómo la planta refleja cieras frecuencias (algunas longitudes de onda son absorbidas mientras que otras son reflejadas).

Al final de este proceso tenemos un mapa de Cantabria con una alta resolución (10 m). Se trata de una imagen con más de 88 millones de píxeles a analizar. Y para cada uno de estos píxeles tenemos 12 medidas proporcionadas por Copernicus..

Aunque podríamos haber realizado el mapa de uso de suelo utilizando solo una de estas fotografías, esto hubiera sido un enofque demasiado limitado. Queríamos añadir más valor a este producto. Para ello, aprovechando que los Sentinel pasan por encima de Cantabria cada 5 días, usamos fotografías a lo largo de varios años, para tener en cuenta también la variación estacional de la vegetación. Esto proporciona resolutados más precisos, y complica nuestro modelo. Para entrenar este modelo empleamos finalmente varias fotografías de toda Cantabria entre 2016 y 2019.

Three types of forests: beech, conifers and eucalyptus
Bosque de hayas, eucaliptos y coníferas. Tres ejemplos de las categorías EUNIS para vegetación que nuestro algoritmo puede clasificar.

Una vez obtenidas estas fotografías detalladas estábamos preparados para entrenar la red neuronal. Como el objetivo era modelar la variabilidad espacial y temporal de la vegetación, y teníamos que manejar un dataset con una alta dimensionalidad, optamos por una Red Neuronal Convolucional con convoluciones 3-dimensionales. A la hora de entrenar el modelo, IHCantabria nos facilitó un set de datos con 26 categorías EUNIS. Estas categorías comprendían las vegetaciones más habituales de la región: desde bosques de eucaliptos y coníferas hasta tierras de pasto extensivas y arbustos calcícolas.

On the left, a land use map from Scotland from 1930s. On the right, the same region on a land use map of 2015.
A la izquierda, el conjunto de datos de trabajo de campo. Parte de estos datos fueron usados para entrenar el algoritmo. La parte restante se uso para evaluar su precisión. Gracias a ello desarrollamos el mapa de la derecha: un mapa preliminar, mostrando la cateogría EUNIS más probable para cada categoría.

Para cada uno de los píxeles de la imagen, el modelo proporciona la probabilidad de que dicho pixel pertenezca a una determinada categoría EUNIS. Para proporcionar al usuario la información de la forma más útil posible, mostramos al usuario la información de diferente maneras:

  • Mostrando solo la categoría más probable: en este caso, el modelo tiene una precisión de 59.06%.
  • Mostrando las tres categorías más probables: en este modo la precisión aumenta al 83.89%.

Para mejorar el modelo, añadimos posteriormente imágenes LiDAR proporcionadas por IHCantabria. Hicimos este proceso por separado, puesto que estas imágenes no tenían el mismo espaciado temporal que el tresto de los datos.El valor añadido del LiDAR reside en que proporcionan un mapa de alturas muy útil. Estos datos añadidos permiten distingui fácilmente entre arbustos y árboles. En este caso, l la precisión aumenta a un 61.78%  si consideramos solo una categoría, y a una 85.49% si consideramos las tres categorías.

A lo largo de todo el proceso también conseguimos optimizar el tiempo de procesamiento necesario para producir un mapa de usao de suelo, pasando de las dos semanas iniciales a cuatro días. Gracias a ltrabajo conjunto de nuestro equipo, los investigadores de IHCantabria y los datos de Copernicus, hemos conseguido desarrollar un producto de alto valor añadido, que reduce los costes de realizar este tipo de mapas de uso de suelo.

Descubre el mapa interactivo en nuestro Showcase!