Eredità del Vento

Il Ventaglio dell'Eredità

Scoprire esattamente come l'apprendimento automatico e l'intelligenza artificiale potrebbero migliorare i modelli classici di previsione numerica del tempo è ancora nelle prime fasi. ¶ Credito: jkgeography.com

La frase “libero come il vento” può essere accurata dal punto di vista filosofico, ma nel mondo fisico, il vento non è sempre libero. Presenta opportunità e costi. Prevedere con precisione il vento comporta conseguenze economiche e umanitarie reali, sia a livello macro che micro-climatico. Spesso, le cause e gli effetti tra fenomeni atmosferici su larga scala e su piccola scala fanno parte della stessa equazione, letteralmente e metaforicamente.

Pur non essendo nuove, le ricerche sull’efficacia dell’intelligenza artificiale (AI) e dell’apprendimento automatico (ML) nel campo del meteo devono ancora fare progressi significativi nei modelli di previsione operativa. Tuttavia, la loro economia computazionale relativa, ovvero la capacità di eseguire dataset molto più ampi e molto più velocemente rispetto ai modelli di previsione consolidati, ha portato sia la comunità meteorologica che quella informatica a prepararsi per un imminente era di significativa integrazione intellettuale.

Le più avanzate ricerche di ML nel campo del meteo stanno combinando dataset di allenamento basati su dati di rianalisi storici di modelli consolidati con nuove osservazioni, dove anche i dati provenienti da progetti che non hanno utilizzato l’apprendimento automatico potrebbero essere di grande beneficio per i modelli futuri, e viceversa.

In uno di questi progetti che ha utilizzato modelli di previsione tradizionali, ricercatori della Colorado State University e della National Oceanic and Atmospheric Administration (NOAA) hanno scoperto che miglioramenti nelle previsioni del vento per il modello High-Resolution Rapid Refresh (HRRR), uno dei modelli più utilizzati negli Stati Uniti, avrebbero potuto comportare un incremento potenziale di $384 milioni di dollari nel reddito reale a livello nazionale, se i modelli HRRR aggiornati fossero stati in uso durante i periodi di aggiornamento del modello. Prevedere con precisione il vento è fondamentale per una pianificazione efficiente delle risorse di utilità; prevedere una quantità di energia eolica disponibile maggiore rispetto a quella che effettivamente si verifica può portare a interruzioni dell’ultimo minuto verso una generazione di energia più costosa basata sui combustibili fossili. Al contrario, previsioni di vento insufficienti possono causare sovrainserzioni di altre fonti di elettricità durante un periodo in cui potrebbero essere a riposo.

Questi progetti sono stati chiamati il Progetto di Miglioramento delle Previsioni del Vento. La prima fase, WFIP-1, è stata condotta dal 2011 al 2013, raccogliendo dati dalle Grandi Pianure e dall’ovest del Texas. La seconda fase, WFIP-2, si è svolta dal 2015 al 2019 nel bacino del fiume Columbia negli stati del Pacifico nord-occidentale dell’Oregon e Washington. Tuttavia, per sfruttare i risparmi scoperti, è stato necessario considerare attentamente la raccolta e l’analisi dei dati relativi ai fattori microclimatici. Il team che ha lavorato su WFIP-2, ad esempio, ha scoperto che prevedere con precisione la velocità del vento a quote di turbine eoliche era complicato dalla presenza di “pozze fredde” di aria stagnante nella parte più bassa dell’atmosfera. Queste pozze non erano state previste con precisione prima del progetto, che ha scoperto che la copertura nuvolosa influisce molto sulla loro formazione.

Le pozze fredde “sono un problema per molteplici ragioni”, ha affermato Jim Wilczak, meteorologo di ricerca presso il laboratorio di scienze fisiche della NOAA a Boulder, CO. Wilczak è stato il responsabile tecnico della NOAA per WFIP-1 e il responsabile delle osservazioni per WFIP-2. “Per l’energia eolica sono un problema, perché si produce molto poco energia eolica. Per la qualità dell’aria, se ci si trova in una di queste valli e ci sono persone che usano camini e automobili che emettono fumo e particelle, queste si accumulano e si creano strati freddi e densi vicino al suolo, molto inquinanti”.

Il lavoro su WFIP può anche rappresentare un punto di demarcazione tra un’epoca in cui i modelli meteorologici consolidati, chiamati modelli di previsione numerica del tempo (NWP), venivano principalmente analizzati e modificati utilizzando tecniche di calcolo classiche. I modelli NWP utilizzati dai ricercatori di WFIP contenevano dati osservativi di condizioni che venivano quindi elaborati tramite equazioni fisiche sofisticate, senza includere l’apprendimento automatico di elementi come misurazioni precedenti del vento o la copertura nuvolosa in quelle posizioni. Sebbene i risultati operativi delle previsioni del tempo basate su ML siano ancora agli inizi, Wilczak ha affermato di non aspettarsi che lo status quo duri a lungo.

“Nessun apprendimento automatico è stato realmente applicato a WFIP-1 o WFIP-2. Stavamo cercando strettamente di migliorare i modelli attuali di Previsione Numerica del Tempo (NWP)”, ha detto. “Ma penso che non passerà molto tempo prima che i modelli di apprendimento automatico superino la capacità previsionale dei modelli NWP attuali.”

Capire esattamente come l’apprendimento automatico e l’IA potrebbero migliorare i modelli classici di NWP è ancora nelle fasi iniziali, ma la promessa di queste tecnologie è evidente per Wilczak e gli altri.

Ad esempio, Wilczak ha detto che i dati di una particolare topografia, come le zone fredde trovate nella Columbia River Gorge, avevano una limitata trasferibilità nello studio possibile dei venti in un’altra topografia, come i parchi eolici in cima alle colline nell’upstate New York.

Tuttavia, i futuri ricercatori (o meteorologi operativi) che utilizzano l’apprendimento automatico in topografie simili in qualsiasi parte del mondo potrebbero essere in grado di utilizzare tali dati grezzi in tandem con i dati di rianalisi.

“In questo senso, programmi sul campo come i WFIP potrebbero essere potenzialmente importanti per fornire il tipo di misurazioni che possono essere inserite negli algoritmi di apprendimento automatico per cercare di migliorare le previsioni”, ha detto Wilczak.

L’aggiunta di tali dati non deve essere costosa dal punto di vista computazionale; in un saggio di sintesi che copriva gli sforzi per incorporare l’IA nel National Weather Service negli Stati Uniti nell’agosto 2023 Bulletin of the American Meteorological Society, Paul J. Roebber e Stephan Smith hanno indicato uno studio che ha utilizzato un modello di apprendimento profondo addestrato con dati di rianalisi che ha generato 85.800 nuove previsioni in poche ore su una singola unità di elaborazione grafica.

Satelliti e ricerche ispirate all’LLM

La fine dell’estate e l’inizio dell’autunno nell’emisfero boreale sono momenti cruciali per la formazione di tempeste tropicali e uragani che possono deviare innocuamente verso il mare o causare un disastroso impatto sulla terraferma, distruggendo proprietà e causando gravi ferite e morti. L’uragano Ian, un uragano di categoria 4 con venti sostenuti di 150 miglia all’ora quando ha colpito la Florida nel settembre 2022, ha ucciso 160 persone a Cuba e negli Stati Uniti, causando danni compresi tra 50 e 65 miliardi di dollari. Due dei modelli di previsione più utilizzati, il GFS e il Euro, erano in disaccordo su quale zona avrebbe colpito la tempesta, il che potrebbe aver portato a un numero di morti maggiore del previsto.

Uno degli uragani più grandi del 2023, l’uragano Lee, aveva il potenziale di essere altrettanto catastrofico e difficile da prevedere. Mentre si muoveva nell’oceano Atlantico meridionale, minacciando possibilmente un’ampia area della costa nord-orientale degli Stati Uniti e del Canada, i pionieri della ricerca sull’IA nel campo meteorologico hanno dichiarato a Communications che il loro lavoro potrebbe rendere più facile la previsione di tali tempeste.

“Assolutamente sì, il nostro lavoro potrebbe aiutare a raccogliere dati sugli uragani come Lee”, ha detto Xubin Zeng, direttore del centro di dinamica climatica e idrometeorologia dell’Università dell’Arizona, a proposito di un recente studio condotto da lui e dal suo team di ricerca. Hanno utilizzato dati di immagini satellitari a infrarossi per prevedere la velocità del vento a diverse altezze utilizzando il movimento del vapore acqueo. Amir Ouyed, autore principale dello studio e ricercatore scientifico, ha sviluppato algoritmi di apprendimento automatico per elaborare le immagini. Confronti con le misurazioni dei palloni meteorologici hanno mostrato che i recuperi del vento derivati dal loro metodo erano all’interno dell’intervallo di errore dei prodotti di vento satellitari esistenti e li superavano in risoluzione verticale.

“Una parte della ragione per cui lavori come il nostro potrebbero essere preziosi è che sull’oceano aperto non hai alcuna osservazione reale del vento”, ha detto Zeng. “Per questo motivo NOAA spende così tanti soldi ogni stagione degli uragani per inviare aerei per effettuare misurazioni.”

Christian Lessig, scienziato capo di AtmoRep, un ambizioso sforzo di previsione del tempo basato sull’IA in Europa, ha dichiarato che questa tecnologia potrebbe essere davvero un vantaggio per le previsioni meteorologiche dei fenomeni meteorologici estremi. “Potrebbe non essere possibile prevedere esattamente dove andrà l’uragano, ma è possibile eseguire previsioni probabilistiche migliori. Poiché i modelli di IA sono più economici dei modelli convenzionali, è possibile generare insiemi molto più ampi e ottenere una migliore probabilità di dove potrebbe andare l’uragano.”

I progetti di Zeng e Lessig potrebbero rappresentare il lato positivo e negativo dell’esplorazione dell’IA nella previsione dei venti. Il team di Zeng ha esaminato immagini relativamente piccole per derivare previsioni assistite dalla computer vision sui venti a diverse altezze all’interno di una data pila verticale, qualcosa che era stato impraticabile o impossibile con gli strumenti meteorologici disponibili per le previsioni operative. Grazie alla fortunata lunga vita di un satellite NOAA, che orbitava nello stesso cerchio ma a 50 minuti di distanza da uno più nuovo, Zeng e il suo team sono stati in grado di utilizzare dati pixelati differenziati per discernere i movimenti del vapore acqueo, che sono influenzati dal modo in cui i venti spostano il vapore e non sono visibili all’occhio umano.

Al contrario, AtmoRep si ispira ai principi dei grandi modelli di linguaggio (LLM). I suoi creatori hanno l’obiettivo di addestrare una rete neurale generativa che rappresenti e descriva tutte le dinamiche atmosferiche, incluse il vento; la sua struttura modulare consentirebbe a ricercatori e meteorologi di estrarre vari elementi, tra cui il vento, le precipitazioni, le temperature, e così via. Tuttavia, la sfida di costruire un tale modello è impegnativa. Deve affrontare processi e insiemi di dati molto più complessi rispetto ai modelli di elaborazione del linguaggio naturale; il modello ha 3,5 miliardi di parametri.

AtmoRep è addestrato sul dataset di analisi dei dati meteo ERA5 del Centro europeo di previsione meteorologica a medio termine (ECMWF), che include stime orarie dei parametri atmosferici come temperatura dell’aria, pressione atmosferica e velocità del vento a diverse altitudini. Include anche parametri di superficie come pioggia, contenuto di umidità del suolo, altezza delle onde oceaniche e temperatura della superficie del mare, che coprono il periodo gennaio 1940 fino ad oggi.

Per mitigare i bias intrinseci nei dati di addestramento, AtmoRep può anche utilizzare dati osservativi contemporanei, come ha ipotizzato Wilczak; nella loro introduzione preliminare al progetto, l’ultima revisione è stata effettuata all’inizio di settembre, il team di AtmoRep ha introdotto i dati del radar di precipitazione RADKLIM del servizio meteorologico nazionale della Germania. Il risultato ha mostrato che l’estensione e la forma dei campi di precipitazione previsti da AtmoRep sono molto più simili a RADKLIM rispetto ai dati originali di ERA5.

In teoria, ha detto Lessig, ricerche come quella di Zeng potrebbero essere molto utili per aggiungere reti neurali come AtmoRep.

“Uno dei punti di forza dell’apprendimento automatico è che può combinare diverse fonti di dati in un modello coerente di rete neurale, come LLM addestrati su testi provenienti da fonti molto diverse o modelli di testo-immagine che combinano testi e immagini in una rappresentazione interna astratta”, ha detto. “Si può quindi immaginare che l’addestramento su reanalisi e dati come quelli ottenuti da Ouyed e suoi colleghi possa essere combinato per arricchirsi a vicenda”.

Lessig ha detto che la relativa scarsità delle immagini del team di Zeng – 1 grado, o 100 chilometri – limitava la loro utilità nella riduzione di scala (una tecnica utilizzata per tradurre i dati dei modelli su larga scala in scale spaziali più piccole, come un unico bacino idrografico). Tuttavia, ha osservato, altre misurazioni satellitari hanno risoluzioni da 1 a 5 chilometri e i sistemi di osservazione del territorio lavorano con risoluzioni di circa 10m. Lessig ha detto di sperare che l’intenzione del team di rendere il codice di AtmoRep open source possa incoraggiare altri a contribuire e ottenere dati e codice secondo un vero modello di comunità.

Lo studio di Zeng e i progetti WFIP potrebbero essere esattamente il tipo di basi fondamentali su cui una tale comunità può costruirsi attorno. Zeng ha detto che i risultati del lavoro del suo team sono una dimostrazione della fattibilità di una futura missione satellitare in cui sperano di fornire una risoluzione di 10 km, aggiungendo che l’aumento della contaminazione incrociata tra meteorologia e ricerca sull’apprendimento automatico si trova in un punto di incontro entusiasmante.

“Il mio gruppo non è lo sviluppatore della tecnologia effettiva, l’abbiamo utilizzata dal campo delle scienze informatiche”, ha detto Zeng. “Così funziona la scienza. Impariamo gli uni dagli altri”.

Gregory Goth è uno scrittore con sede a Oakville, CT, specializzato in scienza e tecnologia.