Uno studio su vari modelli di previsione del tempo basati sull’apprendimento profondo

Uno studio sui modelli di previsione del tempo basati sull'apprendimento profondo

A causa del suo impatto sulla vita umana in tutto il mondo, la previsione del tempo ha suscitato l’interesse di diversi ricercatori provenienti da diverse comunità di ricerca. Molti studi sono stati incentivati a esplorare modelli gerarchici nascosti nel grande volume di dati meteorologici per la previsione del tempo, grazie allo sviluppo recente delle tecniche di deep learning, alla disponibilità diffusa di grandi quantità di dati di osservazione meteorologica e all’avvento della tecnologia dell’informazione e dei computer. Le tecniche di apprendimento automatico sono state applicate per prevedere eventi meteorologici estremi, identificare modelli meteorologici e climatici estremi nelle condizioni atmosferiche osservate e modellate e fornire orientamenti operativi e valutazioni del rischio per il maltempo. Negli ultimi anni si è assistito allo sviluppo di modelli di previsione del tempo basati su deep learning come MetNet-2, WF-UNet, ClimaX, GraphCast, Pangu-Weather e altri. Questo articolo discute brevemente questi modelli per avere una panoramica di come questi modelli stiano rapidamente superando i simulatori meteorologici tradizionali di molto.

ClimaX: Modello Fondamentale per il Tempo e il Clima

I modelli atmosferici numerici basati sulla fisica sono la base del software di previsione del tempo e del clima odierno. Queste tecniche modellano dinamiche non lineari e intricate interazioni multivariate, rendendo difficile approssimarle. La simulazione numerica dei processi atmosferici con elevata risoluzione spaziale e temporale richiede molte risorse computazionali. Le tecniche basate sull’apprendimento automatico e basate sui dati affrontano direttamente le attività di previsione o proiezione utilizzando reti neurali profonde. Queste reti mancano di generalità dei modelli numerici poiché vengono addestrate su dati climatici limitati e coerenti per compiti spazio-temporali discreti.

Nuove ricerche condotte da Microsoft Autonomous Systems and Robotics Research, Microsoft Research AI4Science e UCLA presentano ClimaX, un modello di deep learning per la scienza del tempo e del clima che può essere addestrato su diversi set di dati con diverse variabili, copertura spaziale e temporale e fondamenti fisici. ClimaX utilizza i set di dati climatici CMIP6 per l’addestramento non supervisionato. Per aumentare la capacità di calcolo mantenendo un’ampia usabilità, ClimaX espande Transformer con nuovi blocchi di codifica e aggregazione.

Dopo l’addestramento iniziale, ClimaX può essere ottimizzato per eseguire una vasta gamma di attività climatiche e meteorologiche, comprese quelle che coinvolgono variabili atmosferiche e diverse scale temporali e spaziali. Anche quando viene preaddestrato a risoluzioni più basse e con budget computazionali ridotti, l’universalità di ClimaX gli consente di superare i baselines basati sui dati nelle previsioni del tempo e nei benchmark per la previsione del clima.

I ricercatori ritengono che l’universalità di questo metodo possa renderlo utile per scopi più diversificati. Ciò potrebbe includere la previsione di eventi meteorologici estremi e la valutazione del cambiamento climatico antropogenico, due esempi di compiti di scienze dei sistemi terrestri che potrebbero beneficiare di una struttura di base ClimaX che è già stata addestrata. L’agricoltura, la demografia e le scienze attuariali sono anche candidati interessanti a causa dei loro stretti legami con il tempo e il clima.

Pangu-Weather per la Previsione del Tempo Globale

Un team di ricercatori di Huawei Cloud Computing ha introdotto Pangu-Weather, un sistema di previsione del tempo globale basato su deep learning. Il team ha raccolto 43 anni di dati meteorologici globali orari dalla rianalisi di quinta generazione dell’ECMWF (ERA5) per creare un ambiente basato sui dati e addestrare alcune reti neurali profonde con 256 milioni di parametri.

Questo è il primo approccio basato sull’intelligenza artificiale che supera le tecniche di previsione meteorologica numerica all’avanguardia in termini di accuratezza di tutte le variabili (come il geopotenziale, l’umidità specifica, la velocità del vento, la temperatura, ecc.) e su tutte le scale temporali (da un’ora a una settimana). L’accuratezza delle previsioni viene aumentata utilizzando una strategia di aggregazione temporale gerarchica e un’architettura 3D Earth Specific Transformer (3DEST) che trasforma i dati di altezza (livello di pressione) in dati cubici. La previsione deterministica a breve e medio termine è il punto di forza di Pangu-Weather (cioè, l’intervallo di tempo della previsione varia da un’ora a una settimana).

Dal Pangu-Weather sono disponibili diverse opzioni di previsione a valle, come il tracciamento dei cicloni tropicali e la previsione degli ensemble in tempo reale. Pangu-Weather risponde alla domanda se le tecniche basate sull’intelligenza artificiale possano avere prestazioni migliori rispetto alle tecniche di previsione meteorologica numerica e fornisce nuove raccomandazioni per migliorare i sistemi di previsione del tempo basati sul deep learning.

Il team ritiene che il loro metodo di addestramento non abbia ancora raggiunto la piena convergenza. C’è spazio per aumentare il numero di componenti osservative, integrare la dimensione temporale nell’addestramento di reti neurali profonde a 4D e utilizzare reti più profonde e/o più ampie. Tutto ciò richiede GPU con più memoria e FLOPs. Pertanto, le previsioni future del tempo saranno migliori grazie alle risorse computazionali.

Un Framework di Deep Learning a Multi-Risoluzione

Gli eventi meteorologici estremi minacciano notevolmente la vita umana e l’economia, con costi annuali che si aggirano miliardi di dollari e un costo umano nell’ordine delle decine di migliaia. A causa dei cambiamenti climatici, si prevede che le loro conseguenze e intensità aumenteranno. Il principale strumento per le proiezioni climatiche, i modelli di circolazione generale (GCM), purtroppo non sono in grado di definire adeguatamente gli estremi meteorologici.

Un gruppo di scienziati di Verisk Analytics, dell’Università Otto-von-Guericke e del Massachusetts Institute of Technology ha sviluppato un quadro di apprendimento profondo a multi-risoluzione per accelerare la simulazione di eventi climatici estremi. Per eliminare i bias e migliorare la risoluzione della simulazione GCM, combinano un GCM basato sulla fisica eseguito a bassa risoluzione con modelli di apprendimento automatico addestrati su dati osservativi.

Gli ingredienti principali sono:

  • Una strategia di addestramento di divisione e conquista che consente l’addestramento di modelli regionali a una risoluzione spaziale elevata
  • Nuove funzioni di perdita statistica che enfatizzano i valori estremi e la coerenza spazio-temporale
  • Una rappresentazione compatta e multi-scala dei processi fisici sulla sfera che cattura efficientemente i trasferimenti di energia tra le scale.

Un decisore può utilizzare la simulazione senza bias a piena scala per osservare gli scenari attuali e valutare la propria esposizione a disastri meteorologici catastrofici, tutto con un livello di dettaglio arbitrario.

L’architettura suggerita rende possibili le simulazioni di eventi climatici estremi di milioni di anni, migliorando la quantificazione degli eventi catastrofici. Poiché la necessità di simulazioni globali che tengano conto delle interdipendenze tra molte geografie e minacce continua a crescere, i ricercatori ritengono che ciò contribuirà a soddisfare tale requisito.

Correzione in tempo reale dei previsioni del campo del vento

Le previsioni del Centro europeo per le previsioni meteorologiche a medio termine (ECMWF; EC per breve) possono fungere da base per lo sviluppo di sistemi di allerta per i disastri marittimi ma presentano alcuni bias sistemici. I dati di rianalisi atmosferica di quinta generazione della Commissione europea (ERA5) sono molto accurati; tuttavia, arrivano con alcuni giorni di ritardo. L’approccio di mappatura non lineare tra i dati di EC e ERA5 potrebbe essere migliorato con un approccio di apprendimento profondo spazio-temporale, consentendo previsioni del vento in tempo reale più accurate da EC.

Uno studio recente dell’Università degli oceani della Cina, del Centro per le previsioni dell’ambiente marino nazionale e dell’Università di Portsmouth ha progettato una funzione di perdita di apprendimento multi-task per correggere la velocità del vento e la direzione del vento utilizzando un singolo modello. L’hanno implementato nel modello Multi-Task-Double Encoder Trajectory Gated Recurrent Unit (MT-DETrajGRU), che utilizza un’architettura “double-encoder forecaster” migliorata per modellare i componenti spazio-temporali della sequenza del vento. La regione di ricerca è stata il Pacifico occidentale del Nord (WNP). Le previsioni del campo del vento di 10 giorni di EC sono state corrette per il bias in tempo reale da dicembre 2020 a novembre 2021 in tutte e quattro le stagioni. Dopo essere state regolate con il modello MT-DETrajGRU, la velocità del vento e il bias della direzione del vento nelle quattro stagioni sono stati ridotti rispettivamente dell’8-11% e del 9-14% rispetto alle previsioni originali di EC.

Inoltre, la tecnica proposta ha modellato i dati in modo coerente in diverse condizioni climatiche. La modalità basata sui dati costruita qui è resiliente e generalizzabile, come dimostrato dalle prestazioni di correzione simili in condizioni normali e di tifone. Il team ha intenzione di incorporare nelle future indagini altre variabili che influenzano il campo del vento, come temperatura, pressione atmosferica e umidità, nel modello.

Previsione della potenza degli impianti eolici e delle code a valle utilizzando i modelli meteorologici

Uno nuovo studio di ECMWF, Bonn, Imperial College London, UK Meteorological Office, Exeter e Shell Research Ltd stabilisce un nuovo flusso di lavoro per l’energia eolica che mostra per la prima volta come i complessi modelli di previsione del tempo numerica possano essere integrati con algoritmi di clustering non supervisionati per effettuare previsioni accurate a lungo termine della potenza degli impianti eolici e delle code a valle. Questa procedura inizia identificando le tendenze meteorologiche utilizzando il clustering non supervisionato k-means sui dati di rianalisi ERA5 per tener conto della variabilità regionale e temporale. Per calcolare l’output di potenza del cluster e la code a valle dell’impianto eolico, viene eseguita una simulazione WRF utilizzando le condizioni meteorologiche medie del centro del cluster.

Questa analisi determina la migliore variabile e dimensione del dominio per i modelli di produzione di energia eolica offshore. Dopo l’esecuzione delle simulazioni WRF, il team ha applicato un approccio di post-processing unico alle simulazioni dei cluster per migliorare le previsioni a lungo termine dell’output di potenza e della code a valle del vento. Il nuovo metodo consente stime pluriennali e pluridecennali della potenza degli impianti eolici offshore e delle code a valle senza eseguire una simulazione. Mentre ricerche precedenti hanno esaminato a piccola scala le code a valle degli impianti eolici, questo è il primo strumento che riduce queste code fornendo previsioni precise e rapide a lungo termine che migliorano la conoscenza sulla localizzazione degli impianti eolici.

Applicando questo approccio a due regioni di studio, il team dimostra che, pur richiedendo meno del 2% dell’impegno computazionale, le previsioni a lungo termine proposte raggiungono un ottimo accordo con quelle ottenute da un anno di simulazioni WRF. I risultati sono più precisi quando si raggruppa in base alla velocità del vento.

GraphCast: Fornire previsioni meteorologiche globali efficienti a VoAGI-range

Dal scegliere un abito a cosa fare in caso di uragano, le persone regolano costantemente i loro piani in base alle previsioni del tempo. Le persone si affidano alle previsioni meteorologiche “VoAGI-range”, che vengono emesse dai servizi meteorologici fino a quattro volte al giorno, per prendere decisioni che richiedono conoscenza del tempo a dieci giorni nel futuro.

Uno studio recente condotto da DeepMind e Google introduce GraphCast. Questo nuovo simulatore meteorologico basato su machine learning supera il sistema di previsione meteorologica operativa VoAGI-range deterministica più accurato al mondo e tutti i modelli di machine learning di riferimento. Il modello autoregressivo di GraphCast è addestrato utilizzando dati meteorologici provenienti dall’archivio di ri-analisi ERA5 presso il Centro Europeo per la previsione meteorologica a VoAGI-Range (ECMWF). Il modello è basato su reti neurali a grafo e su una rappresentazione mesh multi-scala ad alta risoluzione. Ha una risoluzione di circa 25×25 chilometri all’equatore e può creare previsioni di 10 giorni con intervalli di 6 ore per cinque superfici e sei variabili atmosferiche, ognuna con 37 livelli di pressione verticali.

Nel 90,0% delle 2760 combinazioni di variabili e tempi di previsione, GraphCast ha superato il metodo di previsione operativa deterministica di ECMWF, HRES. Per il 99,2% dei 252 obiettivi segnalati, GraphCast ha superato il modello di previsione meteorologica basato su machine learning più accurato precedentemente disponibile. Con la tecnologia Cloud TPU v4, GraphCast può produrre una previsione di 10 giorni (35 GB di dati) in meno di 60 secondi.

A differenza delle tecniche di previsione più tradizionali, la previsione basata su machine learning può facilmente crescere in dimensione e complessità man mano che diventano disponibili dati aggiuntivi per l’addestramento. Questo studio rappresenta un importante avanzamento per la modellazione meteorologica basata su machine learning. In linea di principio, può essere applicato a un insieme molto più ampio di sfide di previsione ambientale e geospaziale-temporale, come la modellazione di vari fattori meteorologici e le previsioni stagionali e climatiche, gli incendi, la deforestazione, ecc.

WeatherFusionNet per la previsione delle precipitazioni da dati satellitari

I metodi di deep learning hanno migliorato recentemente l’accuratezza delle previsioni meteorologiche. Ricercatori dell’Università Tecnica Ceca di Praga hanno presentato due modelli di deep learning per prevedere le precipitazioni alla sfida del 2021 AI for Good World Summit sulla previsione di fenomeni meteorologici estremi.

Il primo modello, sat2rad, è un modello di deep learning basato su U-Net che stima le precipitazioni nell’attuale intervallo di tempo del frame satellitare. Questo modello prevede le precipitazioni per l’intera area del satellite utilizzando l’invarianza spaziale delle reti neurali convoluzionali, anche se i dati radar sono disponibili solo per un’area più piccola. Il modello sat2rad è stato applicato separatamente a tutti e quattro i frame satellitari per generare quattro canali.

Il secondo modello, PhyDNet, è una rete convoluzionale ricorrente che separa la dinamica fisica dal input visivo supplementare. Due rami di PhyDNet gestiscono la dinamica fisica e le informazioni residue per la previsione futura. A causa dei limiti della competizione, PhyDNet è stato addestrato su dati satellitari anziché su frame radar. Per effettuare la previsione, un altro U-Net fonde le uscite di entrambi i modelli con la sequenza di input.

Lo studio ha indicato che l’utilizzo dei modelli sat2rad e PhyDNet ha incrementato la previsione delle precipitazioni. L’invarianza spaziale delle reti neurali convoluzionali ha aiutato a stimare le precipitazioni per l’intera area del satellite, anche se i dati radar erano disponibili solo per un’area più piccola.

WF-UNet: Weather Fusion UNet per la previsione delle precipitazioni a breve termine

Le previsioni accurate a breve termine (nowcasts) delle precipitazioni sono necessarie per progettare sistemi di allarme precoce per i fenomeni meteorologici estremi e le loro conseguenze, come allagamenti urbani o frane. Ci sono diverse applicazioni ambientali per le previsioni a breve termine, dalla gestione agricola al miglioramento della sicurezza dell’aviazione.

Una ricerca collaborativa tra l’Università di Maastricht e l’Università di Utrecht esplora la fattibilità dell’utilizzo di un modello centrale UNet e di un’estensione di quel modello per prevedere le precipitazioni nell’Europa occidentale fino a tre ore in anticipo. Lo studio propone il modello Weather Fusion UNet (WF-UNet), che si basa sul modello Core 3D-UNet includendo variabili come la velocità del vento e le precipitazioni nel processo di addestramento e analizzando poi come questi fattori influenzano le prestazioni dell’obiettivo di prevedere le precipitazioni.

Utilizzando il dataset ERA5 di Copernicus, il programma di osservazione della Terra dell’Unione Europea, il team ha raccolto immagini radar di precipitazioni e vento per sei anni (gennaio 2016 – dicembre 2021) in 14 nazioni europee, con risoluzione temporale di 1 ora e risoluzione spaziale di 31 chilometri quadrati. Hanno valutato il modello proposto WF-UNet rispetto al modello di persistenza e ad altre architetture basate su UNet addestrate solo con dati radar di precipitazioni. Secondo i risultati, il WF-UNet ottiene un MSE inferiore del 22%, 8% e 6% rispetto agli altri modelli di migliore performance analizzati quando l’orizzonte temporale è di 1, 2 e 3 ore rispettivamente. Rispetto al tradizionale modello UNet, la fusione a livello di decisione è superiore nel catturare le informazioni spazio-temporali incluse nelle immagini radar archiviate. Il WF-UNet supera gli altri modelli basati su UNet testati nel nowcasting a breve termine grazie alle sue capacità superiori di estrazione delle caratteristiche.