Il modello di fondazione geospaziale watsonx.ai di IBM, costruito a partire dai dati satellitari della NASA, sarà ora apertamente disponibile disponibile su Hugging Face. Sarà il più grande modello di fondazione geospaziale sulla piattaforma di intelligenza artificiale e il primo open source mai realizzato in collaborazione con la NASA.
L’accesso ai dati più recenti rimane una sfida significativa nella scienza del clima, dove le condizioni ambientali cambiano quasi ogni giorno. E, nonostante la crescente quantità di dati – le stime della NASA suggeriscono che entro il 2024 gli scienziati avranno 250.000 terabyte di dati provenienti da nuove missioni – scienziati e ricercatori devono ancora affrontare ostacoli nell’analisi di questi grandi set di dati.
Nell’ambito di un accordo Space Act con la NASA, IBM ha deciso all’inizio di quest’anno di costruire un modello di base di intelligenza artificiale per i dati geospaziali. E ora, rendendolo disponibile tramite Hugging Face, società nota nell’open source e con un archivio di tutti i modelli di trasformatori – gli sforzi possono progredire per democratizzare l’accesso e l’applicazione dell’intelligenza artificiale per generare nuove innovazioni nelle scienze del clima e della Terra.
L’importanza delle tecnologie open source
“Il ruolo essenziale delle tecnologie open source per accelerare la scoperta di aree critiche come il cambiamento climatico non è mai stato così chiaro”, ha affermato Sriram Raghavan, Vice Presidente di IBM Research AI. “Unendo gli sforzi del modello di base di IBM volti a creare sistemi di intelligenza artificiale flessibili e riutilizzabili con il repository di dati della NASA sui satelliti della Terra e rendendoli disponibili sulla principale piattaforma di intelligenza artificiale open source, Hugging Face, possiamo sfruttare la potenza della collaborazione per implementare più rapidamente e soluzioni di maggiore impatto che miglioreranno il nostro pianeta.”
“L’intelligenza artificiale rimane un campo guidato dalla scienza e la scienza può progredire solo attraverso la condivisione delle informazioni”, ha dichiarato Jeff Boudier, responsabile del prodotto e della crescita presso Hugging Face. “Ecco perché l’intelligenza artificiale open source e il rilascio aperto di modelli e set di dati sono così fondamentali per il continuo progresso dell’AI e per garantire che la tecnologia vada a beneficio del maggior numero di persone possibile”.
“Crediamo che i modelli di fondazione abbiano il potenziale per cambiare il modo in cui vengono analizzati i dati osservativi e aiutarci a comprendere meglio il nostro pianeta”, ha osservato Kevin Murphy , Chief Science Data Officer, NASA. “E rendendo disponibili al pubblico e al mondo tali modelli, speriamo di moltiplicarne l’impatto.”
Il modello – addestrato congiuntamente da IBM e NASA sui dati satellitari Harmonized Landsat Sentinel-2 (HLS) per un anno negli Stati Uniti continentali e messo a punto su dati etichettati per la mappatura delle cicatrici di inondazioni e ustioni – ha dimostrato fino ad oggi un miglioramento del 15% rispetto a tecniche all’avanguardia utilizzando la metà dei dati etichettati.
Con un’ulteriore messa a punto, il modello di base può essere ridistribuito per attività come il monitoraggio della deforestazione, la previsione dei raccolti o il rilevamento e il monitoraggio dei gas serra. I ricercatori dell’IBM e della NASA stanno anche lavorando con la Clark University per adattare il modello ad applicazioni come la segmentazione delle serie temporali e la ricerca sulla somiglianza.
Si rafforza la collaborazione IBM-Nasa
La notizia segue l’annuncio di IBM all’inizio di quest’anno di collaborare con la NASA per costruire un modello di intelligenza artificiale che potrebbe accelerare l’analisi delle immagini satellitari e promuovere la scoperta scientifica. Fa anche parte della decennale Open-Source Science Initiative della NASA per costruire una comunità scientifica più accessibile, inclusiva e collaborativa. La NASA, insieme alla Casa Bianca e ad altre agenzie federali, ha dichiarato il 2023 Anno della scienza aperta per celebrare i benefici e i successi ottenuti attraverso la condivisione aperta di dati, informazioni e conoscenze.
Il modello sfrutta la tecnologia del modello di base IBM e fa parte del più ampio impegno di IBM per creare e addestrare modelli di intelligenza artificiale che possano essere utilizzati per diverse attività e applicare informazioni da una situazione all’altra. A luglio, IBM ha annunciato la disponibilità di Watsonx, una piattaforma di intelligenza artificiale e dati che consente alle aziende di scalare e accelerare l’impatto dell’intelligenza artificiale più avanzata con dati affidabili. Una versione commerciale del modello geospaziale, che fa parte di IBM Watsonx, sarà disponibile tramite IBM Environmental Intelligence Suite (EIS) entro la fine dell’anno.