Accelerare la scienza della fusione attraverso il controllo del plasma appreso

'Accelerazione scienza fusione tramite controllo plasma appreso'

Controllare con successo il plasma di fusione nucleare in un tokamak con deep reinforcement learning

Per risolvere la crisi energetica globale, i ricercatori hanno a lungo cercato una fonte di energia pulita e illimitata. La fusione nucleare, la reazione che alimenta le stelle dell’universo, è uno dei contendenti. Scontrando e fondendo l’idrogeno, un elemento comune dell’acqua di mare, il potente processo rilascia enormi quantità di energia. Qui sulla Terra, un modo in cui gli scienziati hanno ricreato queste condizioni estreme è utilizzando un tokamak, un vuoto a forma di ciambella circondato da bobine magnetiche, che viene utilizzato per contenere un plasma di idrogeno più caldo del nucleo del Sole. Tuttavia, i plasmi in queste macchine sono intrinsecamente instabili, rendendo complessa la sfida di mantenere il processo necessario per la fusione nucleare. Ad esempio, un sistema di controllo deve coordinare le molte bobine magnetiche del tokamak e regolare la tensione su di esse migliaia di volte al secondo per garantire che il plasma non tocchi mai le pareti del recipiente, il che comporterebbe perdita di calore e possibili danni. Per aiutare a risolvere questo problema e nell’ambito della missione di DeepMind di far avanzare la scienza, abbiamo collaborato con il Swiss Plasma Center presso l’EPFL per sviluppare il primo sistema di deep reinforcement learning (RL) in grado di scoprire autonomamente come controllare queste bobine e contenere con successo il plasma in un tokamak, aprendo nuove vie per l’avanzamento della ricerca sulla fusione nucleare.

In un articolo pubblicato oggi su Nature, descriviamo come possiamo controllare con successo il plasma di fusione nucleare costruendo e eseguendo controller sul Tokamak a Configurazione Variabile (TCV) a Losanna, in Svizzera. Utilizzando un’architettura di apprendimento che combina deep RL e un ambiente simulato, abbiamo prodotto controller in grado di mantenere stabile il plasma e di scolpirlo in diverse forme. Questo “plasma sculpting” dimostra che il sistema RL ha controllato con successo la materia surriscaldata e – cosa importante – consente agli scienziati di indagare come il plasma reagisce in diverse condizioni, migliorando la nostra comprensione dei reattori a fusione.

“Negli ultimi due anni, DeepMind ha dimostrato il potenziale dell’IA per accelerare il progresso scientifico e aprire nuove vie di ricerca in biologia, chimica, matematica e ora fisica.” Demis Hassabis, co-fondatore e CEO di DeepMind

Questo lavoro è un altro potente esempio di come l’apprendimento automatico e le comunità di esperti possano unirsi per affrontare grandi sfide e accelerare le scoperte scientifiche. Il nostro team sta lavorando duramente per applicare questo approccio a campi diversi come la chimica quantistica, la matematica pura, la progettazione dei materiali, la previsione del tempo e altro ancora, per risolvere problemi fondamentali e garantire che l’IA apporti benefici all’umanità.

Foto del Tokamak a Configurazione Variabile (TCV) presso l’EPFL visto dall’esterno (a sinistra, credito: SPC/EPFL) e dall’interno (a destra, credito: Alain Herzog / EPFL) e un modello 3D di TCV con recipiente e bobine di controllo (al centro, credito: DeepMind e SPC/EPFL):

Apprendimento quando i dati sono difficili da acquisire

La ricerca sulla fusione nucleare è attualmente limitata dalla capacità dei ricercatori di condurre esperimenti. Sebbene ci siano dozzine di tokamak attivi in tutto il mondo, sono macchine costose e molto richieste. Ad esempio, il TCV può mantenere il plasma in un singolo esperimento per un massimo di tre secondi, dopodiché ha bisogno di 15 minuti per raffreddarsi e ripristinarsi prima del successivo tentativo. Inoltre, più gruppi di ricerca condividono spesso l’uso del tokamak, limitando ulteriormente il tempo disponibile per gli esperimenti.

Dati gli attuali ostacoli per accedere a un tokamak, i ricercatori si sono rivolti a simulatori per contribuire all’avanzamento della ricerca. Ad esempio, i nostri partner presso l’EPFL hanno sviluppato un potente set di strumenti di simulazione che modellano la dinamica dei tokamak. Siamo stati in grado di utilizzarli per consentire al nostro sistema RL di imparare a controllare il TCV in simulazione e poi convalidare i nostri risultati sul TCV reale, dimostrando che siamo riusciti a scolpire con successo il plasma nelle forme desiderate. Sebbene questo sia un modo più economico e conveniente per addestrare i nostri controller, abbiamo comunque dovuto superare molti ostacoli. Ad esempio, i simulatori di plasma sono lenti e richiedono molte ore di tempo di calcolo per simulare un secondo di tempo reale. Inoltre, le condizioni del TCV possono variare di giorno in giorno, richiedendo lo sviluppo di miglioramenti algoritmici, sia fisici che simulati, e l’adattamento alle realtà dell’hardware.

Successo attraverso la priorità alla semplicità e alla flessibilità

I sistemi di controllo del plasma esistenti sono complessi, richiedendo controller separati per ciascuna delle 19 bobine magnetiche del TCV. Ciascun controller utilizza algoritmi per stimare le proprietà del plasma in tempo reale e regolare la tensione dei magneti di conseguenza. Al contrario, la nostra architettura utilizza una singola rete neurale per controllare tutte le bobine contemporaneamente, imparando automaticamente quali tensioni sono le migliori per ottenere una configurazione del plasma direttamente dai sensori.

Come dimostrazione, abbiamo prima mostrato che potevamo manipolare molti aspetti del plasma con un singolo controller.

Il controller addestrato con deep reinforcement learning guida il plasma attraverso diverse fasi di un esperimento. A sinistra, c'è una vista interna del tokamak durante l'esperimento. A destra, puoi vedere la forma del plasma ricostruita e i punti target che volevamo colpire. (credito: DeepMind & SPC/EPFL)

Nel video sopra, vediamo il plasma nella parte superiore del TCV nel momento in cui il nostro sistema prende il controllo. Il nostro controller prima modella il plasma secondo la forma richiesta, poi sposta il plasma verso il basso e lo distacca dalle pareti, sospendendolo nel mezzo del recipiente su due gambe. Il plasma viene tenuto fermo, come sarebbe necessario per misurare le proprietà del plasma. Poi, infine, il plasma viene guidato di nuovo nella parte superiore del recipiente e distrutto in modo sicuro.

In seguito abbiamo creato una serie di forme del plasma in studio da parte dei fisici del plasma per la loro utilità nella generazione di energia. Ad esempio, abbiamo creato una forma a “fiocco di neve” con molte “gambe” che potrebbe aiutare a ridurre il costo di raffreddamento distribuendo l’energia di scarico su diversi punti di contatto sulle pareti del recipiente. Abbiamo anche dimostrato una forma simile alla proposta per ITER, il tokamak di prossima generazione attualmente in costruzione, dal momento che l’EPFL stava conducendo esperimenti per prevedere il comportamento dei plasmi in ITER. Abbiamo persino fatto qualcosa che non era mai stato fatto prima nel TCV, stabilizzando una “goccia” in cui ci sono due plasmi all’interno del recipiente contemporaneamente. Il nostro singolo sistema è stato in grado di trovare controller per tutte queste diverse condizioni. Abbiamo semplicemente cambiato l’obiettivo richiesto e il nostro algoritmo ha autonomamente trovato un controller appropriato.

Abbiamo prodotto con successo una serie di forme le cui proprietà sono oggetto di studio da parte dei fisici del plasma. (credito: DeepMind & SPC/EPFL)
Il futuro della fusione e oltre

Come abbiamo visto in altri ambiti scientifici in cui è stata applicata l’IA, la nostra dimostrazione di successo del controllo del tokamak mostra il potere dell’IA nel accelerare e assistere la scienza della fusione, e ci aspettiamo un aumento della sofisticazione nell’uso dell’IA in futuro. Questa capacità di creare autonomamente controller potrebbe essere utilizzata per progettare nuovi tipi di tokamak contemporaneamente alla progettazione dei loro controller. Il nostro lavoro indica anche un futuro promettente per l’apprendimento per rinforzo nel controllo di macchine complesse. È particolarmente entusiasmante considerare i settori in cui l’IA potrebbe potenziare l’esperienza umana, fungendo da strumento per scoprire approcci nuovi e creativi per problemi reali complessi. Prevediamo che l’apprendimento per rinforzo sarà una tecnologia trasformativa per le applicazioni di controllo industriale e scientifico nei prossimi anni, con applicazioni che vanno dall’efficienza energetica alla medicina personalizzata.