Para el Banco Mundial, el principal financiador de proyectos de desarrollo económico en el mundo (con 70 mil millones de dólares comprometidos cada año), el apetito por los datos se extiende a todos los países. De hecho, para definir las prioridades de financiación de sus proyectos de infraestructura y reconstrucción, misión número uno de la organización que cuenta con 189 Estados miembros, el establishment necesita "datos consistentes a gran escala", resume Aija Stokenberga, economista senior del Banco Mundial, que habló en la feria Big Data & AI de París a finales de septiembre.
En particular, para financiar las obras de restauración de la red de carreteras en Perú, el establecimiento lanzó un proyecto de recopilación y explotación de datos en octubre de 2022. Objetivo: mapear la red e identificar los tramos que requieren restauración prioritaria. Para ello, el Banco Mundial podría haber utilizado imágenes de alta resolución procedentes de satélites. “Pero el coste alcanza los 5 dólares por kilómetro cuadrado”, señala el economista. Es una factura de más de 6 millones para un país como el Perú. De ahí la elección de explotar todo tipo de datos de libre acceso, para ayudar al gobierno peruano a priorizar su trabajo. “El desafío número uno fue mezclar múltiples fuentes de datos, principalmente de tres tipos: bases de datos de código abierto, como las que contienen datos vectoriales como OpenStreetMap, datos ópticos, particularmente datos de videovigilancia, y datos de radar de apertura sintética (SAR), haciendo Esto permite conocer el estado de la superficie de la red de carreteras”, explica Aija Stokenberga. Datos que, agregados, se utilizan para construir un modelo de red, para enriquecerla - incluso mediante la explotación de datos de otros países para alimentar el algoritmo de Machine Learning -, antes de pasar por una etapa de validación.
Condiciones de la carretera, asociadas a un índice de confianza.
Obviamente, reunir estas múltiples fuentes de datos planteó una serie de dificultades. Primero, comprender los atributos de diferentes conjuntos de datos, su origen y sus formatos. "Tuvimos que filtrar datos innecesarios para conservar sólo la huella necesaria", afirma Aija Stokenberga. Un enfoque que se aplica en particular a los datos de radar SAR, agrupados en mosaicos de 100 km de cada lado, pero mosaicos que se superponen en gran medida entre sí. Para evitar descargas innecesarias, el Banco Mundial pudo conformarse con el 60% de la superficie de los mosaicos iniciales. Por último, era necesario integrar estos diferentes tipos de datos en múltiples formatos, en particular mediante un algoritmo para extraer las características de los conjuntos de datos.
“Sobre esta base pudimos construir un modelo muy completo de la red vial peruana”, asegura el economista. Este modelo indica, por ejemplo, si un determinado tramo está pavimentado o no, y cuál es el estado de la calzada, información asociada a un índice de confianza. » Los más de 500.000 kilómetros de carreteras peruanas fueron mapeados a un costo seis veces menor que el de una inspección visual por parte de agentes. Sobre todo, la creación del modelo sólo llevó unos meses, mientras que una inspección tradicional habría llevado años.
En Perú, el enfoque del Banco Mundial permitió priorizar la restauración de alrededor de 1.000 kilómetros de carreteras. “Pero el modelo puede servir para múltiples propósitos”, continúa Aija Stokenberga. Aún en Perú, estamos estudiando su uso para identificar partes de la red expuestas a inundaciones. » Utilizado en paralelo en México, el modelo sirvió para identificar "qué partes de la red de carreteras podrían ser imputables para financiar otros proyectos" y debería utilizarse mañana, tras enriquecerlo con nuevos conjuntos de datos, para evaluar el nivel de seguridad. que presenta tal o cual camino.
Otras noticias que te pueden interesar