Rivoluzione dei calcolatori basati sulla luce alimentare i programmi di apprendimento automatico di tipo ChatGPT con reti neurali ottiche potenziate

Revoluzione calcolatori luce ChatGPT con reti neurali ottiche

La capacità di ChatGPT di produrre saggi, email e codice di alta qualità in risposta a poche semplici domande ha attirato l’attenzione internazionale. I ricercatori del MIT hanno riportato un metodo che ha il potenziale per aprire la strada a programmi di apprendimento automatico molto più capaci di quello responsabile di ChatGPT. Inoltre, la loro tecnologia potrebbe consumare meno energia rispetto ai supercomputer all’avanguardia che alimentano i modelli di apprendimento automatico di oggi.

Il team riporta la prima dimostrazione sperimentale del nuovo sistema, che utilizza centinaia di laser a scala micron per eseguire calcoli basati sul movimento della luce anziché degli elettroni. Il nuovo sistema è più di 100 volte più efficiente dal punto di vista energetico rispetto ai computer digitali all’avanguardia attuali per l’apprendimento automatico e 25 volte più potente in termini di densità di calcolo.

Inoltre, sottolineano “sostanzialmente diversi ordini di grandezza per miglioramenti futuri”. Questo, aggiungono gli scienziati, “apre una strada verso processori optoelettronici su larga scala per accelerare compiti di apprendimento automatico dai data center ai dispositivi periferici decentralizzati”. In futuro, piccoli dispositivi come i telefoni cellulari potrebbero essere in grado di eseguire programmi che possono essere calcolati solo in enormi data center.

I modelli di apprendimento automatico massivi che imitano l’elaborazione delle informazioni del cervello sono alla base delle reti neurali profonde (DNN) come quella che alimenta ChatGPT. Mentre l’apprendimento automatico si sta espandendo, le tecnologie digitali che alimentano le DNN di oggi stanno raggiungendo un plateau. Inoltre, spesso si trovano solo in data center molto grandi a causa delle loro esigenze energetiche estreme. Questo sta guidando l’innovazione nell’architettura informatica.

La disciplina della scienza dei dati sta evolvendo a causa della crescita delle reti neurali profonde (DNN). In risposta all’espansione esponenziale di queste DNN, che sta mettendo a dura prova le capacità dell’hardware informatico tradizionale, le reti neurali ottiche (ONN) si sono recentemente evolute per eseguire compiti di DNN a frequenze di clock elevate, in parallelo e con una perdita minima di dati. L’efficienza di conversione elettro-ottica bassa, le dimensioni dei dispositivi enormi e l’interferenza dei canali contribuiscono a una bassa densità di calcolo nelle ONN, mentre la mancanza di non linearità in linea causa un ritardo significativo. I ricercatori hanno dimostrato sperimentalmente un sistema ONN spazio-temporale-multiplexed per affrontare tutti questi problemi contemporaneamente. Utilizzano la codifica dei neuroni utilizzando matrici di laser a emissione di superficie a cavità verticale (VCSEL), che sono prodotti in grandi quantità e mostrano un’ottima conversione elettro-ottica.

Per la prima volta, i ricercatori forniscono un piccolo progetto che affronta contemporaneamente questi tre problemi. Questa architettura viene utilizzata nella moderna teledetezione LiDAR e nella stampa laser, ed è basata su matrici di laser a emissione di superficie verticale (VCSEL). Queste misure sembrano rappresentare un miglioramento di due ordini di grandezza nel futuro prossimo. Il processore optoelettronico offre nuove opportunità per velocizzare i processi di apprendimento automatico attraverso infrastrutture centralizzate e distribuite.