La NASA finanzia progetti per rendere i dati geoscientifici più accessibili

La NASA finanzia progetti per rendere i dati geoscientifici più accessibili
Mappa preliminare delle acque superficiali del fiume Ohio realizzata per misurare con precisione le larghezze dei fiumi in tutto il mondo, consentendo ad altri scienziati di utilizzare questi dati e l apprendimento automatico per stimare le portate del fiume. Crediti: immagine di Chandana Gangodagamage, Università del Maryland

La NASA ha accumulato circa 40 petabyte (PB) di dati di scienze della Terra, che è circa il doppio di tutte le informazioni archiviate dalla Library of Congress. Nei prossimi cinque anni, i dati della NASA cresceranno fino a 250 PB, più di sei volte più grandi di quelli che la NASA ha ora. L'enorme quantità di dati forniti dalla NASA offre agli scienziati e al pubblico le ampie informazioni sulle scienze della Terra di cui hanno bisogno per una ricerca e un processo decisionale informato. Ma quella quantità di dati crea una serie di sfide, tra cui come archiviare i dati, come ottenerli in formati coerenti e utilizzabili e come cercare enormi set di dati.

Per aiutare ad affrontare questi problemi, la NASA ha finanziato 11 nuovi progetti come parte del programma Advancing Collaborative Connections for Earth Systems Science (ACCESS) dell'agenzia Earth Science Data Systems. Le proposte presentate nel 2019 e finanziate nel 2020 si sono concentrate su tre aree: apprendimento automatico, scienza nel cloud e strumenti open source.

Gli scienziati della Terra lavorano spesso con i dati raccolti dalle missioni di osservazione spaziale, aerea e terrestre della NASA. Prima di utilizzare tutti questi dati per l'apprendimento automatico, tuttavia, devono creare set di dati di addestramento di grandi dimensioni. Ad esempio, affinché l'apprendimento automatico rilevi una foresta in una nuova immagine satellitare, l'algoritmo deve essere addestrato per rilevare le foreste.

A tale scopo, gli esperti selezionano ed etichettano le aree forestali nelle immagini esistenti e le utilizzano come set di dati di formazione. Una volta che l'algoritmo di apprendimento automatico è stato addestrato esaminando quel set di dati, l'algoritmo può distinguere le aree boschive in nuove immagini satellitari.

La creazione di quel set di dati di addestramento può richiedere mesi o addirittura anni, un problema che la comunità delle geoscienze ha definito il "collo di bottiglia dei dati di addestramento". Per il loro progetto ACCESS, David Roy della Michigan State University e il suo team stanno cercando di accelerare questo processo.

Il progetto di Roy mira a creare un set di dati di formazione di alta qualità e ad alta risoluzione che altri scienziati possono utilizzare per determinare rapidamente quali aree sono bruciate o coperte di alberi. Il progetto utilizza i dati satellitari ad alta risoluzione raccolti quasi ogni giorno dalla costellazione CubeSat di Planet, acquisita nell'ambito del programma CSDA (Commercial SmallSat Data Acquisition) della NASA. Roy e il suo team renderanno disponibili il set di dati di addestramento e il software tramite il programma ACCESS della NASA in modo che altri ricercatori possano creare i propri set di dati di addestramento.

Un altro progetto ACCESS 2019 - guidato da Fritz Policelli, un idrologo presso il Goddard Space Flight Center della NASA a Greenbelt, nel Maryland - si concentra sull'apprendimento automatico con un'applicazione diversa. Il team di Policelli sta creando un set di dati di formazione di alta qualità sulle larghezze dei torrenti per aiutare altri scienziati a misurare la larghezza e la portata dei fiumi in tutto il mondo. Questi dati tengono traccia della quantità di acqua che scorre attraverso un fiume o un torrente nel tempo, il che ha importanti applicazioni per la gestione delle risorse idriche e il monitoraggio delle inondazioni.

Il lavoro di Policelli completerà i dati raccolti dalla missione SWOT (Surface Water and Ocean Topography), il cui lancio è previsto per la fine del 2021. La NASA e il Centre National D'Etudes Spatiales (CNES) stanno sviluppando SWOT con il contributo dell'Agenzia spaziale canadese (CSA ) e l'Agenzia spaziale del Regno Unito.

Tra gli altri dati che raccoglie, SWOT misurerà le portate del flusso in tutto il mondo due volte ogni 21 giorni. Il lavoro di Policelli colmerà le lacune tra i passaggi SWOT utilizzando misurazioni della larghezza del flusso dai dati Sentinel-1 dell'Agenzia spaziale europea (ESA) e l'apprendimento automatico sviluppato dal suo team.

I nuovi dati verranno archiviati, elaborati, analizzati e distribuiti in quel cloud, eliminando il problema di dover scaricare enormi file di dati. Prima dell'archiviazione e dell'elaborazione nel cloud, i ricercatori spesso dovevano pianificare i loro programmi di lavoro in attesa del download di file di dati di grandi dimensioni.

Oltre a ottimizzare gli strumenti di apprendimento automatico per la ricerca il progetto finanziato da ACCESS di Joe Hamman cerca di rendere tali strumenti open source e facilmente accessibili nel cloud. Hamman è il direttore della tecnologia presso l'organizzazione no-profit CarbonPlan di San Francisco. Il suo progetto creerà strumenti che colmano il divario tra il software utilizzato per analizzare i dati di geoscientifici e il software utilizzato nell'apprendimento automatico.

Ad esempio, la conversione dei dati geospaziali, che includono le informazioni sulla posizione, in un formato che può essere utilizzato in modo più efficace nell'apprendimento automatico. Tutti gli strumenti sviluppati saranno open source per aiutare i ricercatori a elaborare i dati da molte fonti diverse, tra cui NASA-USA. La flotta Landsat del Geological Survey (USGS), i satelliti Jason NASA-ESA e lo strumento MODIS a bordo dei satelliti Terra e Aqua della NASA.

 

Clicca qui per vedere i 19 progetti già avviati  


 Copia qui lo "short link" a questo articolo
www.geoforall.it/{sh404sef_shurl}

I contenuti redazionali di questo sito (articoli, editoriali, redazionali, video e podcast) sono soggetti ai seguenti Termini di utilizzo
Redazione mediaGEO società cooperativa
Via Palestro, 95 00185 Roma.
P.I: 11534171001 - Tel. +39 06 64871209 Email: info@mediageo.it
www.mediageo.it
Testata telematica registrata al
Tribunale di Roma
n° 231/2009 del 26-6-2009.