Accelerare le Comunicazioni Ottiche con l’AI

Speeding up Optical Communications with AI

Credit: Shutterstock.com

La computazione fotonica ha visto la sua parte di progressi nella ricerca e profondi inverni di ricerca, molto simili alla storia dell’intelligenza artificiale (AI). Ora, con la ripresa dell’AI, le enormi quantità di energia necessarie ai modelli di grandi reti neurali di oggi quando eseguiti su computer elettronici stanno risvegliando l’interesse nell’unire i due.

Oltre 30 anni fa, durante uno degli impulsi nella ricerca sulle reti neurali artificiali, Demetri Psaltis e i suoi colleghi presso il California Institute of Technology hanno dimostrato come le tecniche dell’olografia potessero eseguire un riconoscimento rudimentale dei volti. Il team ha dimostrato di poter memorizzare fino a un miliardo di pesi per una rete neurale a due strati utilizzando gli elementi core di un display a cristalli liquidi. Simili modulatori di luce spaziale sono diventati la base di diversi tentativi di commercializzare la tecnologia di elaborazione ottica, tra cui quelli della startup britannica Optalysys, che si è concentrata negli ultimi anni sull’applicazione della tecnologia per accelerare la crittografia omomorfica per supportare l’elaborazione remota sicura.

Anche se alcuni gruppi stanno utilizzando i modulatori di luce spaziale per l’AI, rappresentano solo una categoria di computer ottici adatti al lavoro. Esistono anche decisioni su quale forma di reti neurali sia più adatta alla computazione ottica. Alcune tecniche si concentrano sulle operazioni di aritmetica matriciale dei pipeline di deep learning mainstream, mentre altre si concentrano esclusivamente sull’emulazione dei treni di impulsi dei cervelli biologici.

Tutti i sistemi proposti hanno in comune la possibilità che, utilizzando i fotoni per comunicare e calcolare, forniranno importanti vantaggi in densità e velocità rispetto ai sistemi basati esclusivamente sulla segnalazione elettrica. Uno studio del 2021 sull’inferenza basata sull’aritmetica matriciale di Mitchell Nahmias, ora CTO della startup Luminous Computing, e dei suoi colleghi presso la Princeton University, ha sostenuto che l’efficienza teorica dell’inferenza dell’AI nel dominio ottico potrebbe superare di gran lunga quella degli acceleratori convenzionali basati su architetture esclusivamente elettroniche.

La questione chiave per l’apprendimento automatico è la quantità di energia necessaria per spostare i dati intorno agli acceleratori. Gli acceleratori elettronici spesso impiegano strategie per memorizzare nella cache il maggior numero possibile di dati per ridurre questo overhead, con importanti compromessi riguardanti se i risultati temporanei o i pesi sono mantenuti nella cache a seconda della struttura del modello. Tuttavia, il costo energetico per la trasmissione dei fotoni su distanze maggiori della portata di un singolo chip è molto inferiore rispetto alla segnalazione elettrica.

Un secondo potenziale vantaggio dell’AI fotonica deriva dalla facilità con cui può gestire operazioni complesse nel dominio analogico, anche se i risparmi energetici che si possono ottenere in questo caso sono meno certi rispetto alle comunicazioni. Mentre l’aritmetica matriciale si basa su circuiti hardware altamente parallelizzati per le prestazioni nei sistemi convenzionali, il semplice passaggio di fotoni attraverso un componente ottico come un interferometro Mach-Zehnder (MZi) o un anello microresonatore eseguirà l’aritmetica richiedente centinaia o addirittura migliaia di porte logiche in un circuito digitale.

Nel MZi, fasci coerenti di luce passano attraverso una successione di accoppiatori e shifters di fase. Ad ogni punto di accoppiamento, l’interferenza tra i fasci si traduce in spostamenti di fase che possono essere interpretati come parte di una moltiplicazione matriciale. Un’operazione di matrice 4×4 richiede solo quattro ingressi che alimentano sei elementi di accoppiamento, con quattro porte di uscita che forniscono il risultato. La velocità delle operazioni è limitata solo dalla velocità a cui i impulsi coerenti possono passare attraverso l’array.

Nelle architetture analogiche, il rumore rappresenta un ostacolo significativo. Il lavoro di numerosi gruppi sull’accelerazione delle operazioni di inferenza ha dimostrato che le reti neurali profonde possono funzionare con successo ad una risoluzione effettiva di 4 bit, ma l’overhead hardware e l’energia aumentano rapidamente all’aumentare della risoluzione. Questi effetti possono limitare il vantaggio energetico pratico dei progetti fotonic.

Le stime di Alexander Tait, professore assistente presso la Queen’s University di Ontario, hanno riscontrato che i potenziali risparmi energetici possono essere facilmente erosi dalle limitazioni pratiche dei dispositivi ottici attuali. Tait ha calcolato che solo 500 micro-anelli di risonanza che agiscono come neuroni in un layout completamente connesso potrebbero adattarsi a un singolo chip di 1 cm2 utilizzando la tecnologia dei primi anni 2020. Ma, operando a 10 GHz, richiederebbe un kilowatt di potenza. Tait sottolinea che questo esempio mostra l’impatto dell’attuale necessità di riscaldatori per regolare le proprietà ottiche. La scalabilità e le modifiche di progettazione potrebbero ridurre drasticamente l’energia. “I riscaldatori sono certamente un problema risolvibile”, afferma.

Una possibile direzione è quella di utilizzare materiali a cambiamento di fase come quelli utilizzati nei DVD riscrivibili e nelle memorie non volatili. Questi materiali presentano cambiamenti nelle loro proprietà elettro-ottiche in base a quanto rapidamente vengono raffreddati dopo un rapido riscaldamento. Ma poiché non hanno bisogno di riscaldamento costante, comporterebbero computer ottici a basso consumo energetico se fossero in grado di funzionare in modo affidabile.

“Se si dispone di uno shift-fase a bassa energia, ci sono così tante cose che si possono fare nella fotonica integrata”, afferma Carlos Ríos Ocampo, professore di scienza e ingegneria dei materiali presso l’Università del Maryland.

Tuttavia, ci sono differenze in come i materiali possono essere applicati. Tait sottolinea che mentre l’energia delle implementazioni MZi e micro-ring moltiplicatore sono simili oggi, poiché la messa a punto necessaria per i dispositivi MZi è dinamica, la natura non volatile dei materiali a cambiamento di fase non conferisce un vantaggio così grande come per i micro-anelli.

“Se si dispone di uno shift-fase a bassa energia, ci sono così tante cose che si possono fare nella fotonica integrata.”

Un altro fattore a favore dell’elaborazione ottica è che l’alta larghezza di banda e la velocità dell’elaborazione fotonica significa che l’integrazione non deve essere al livello dell’elaborazione elettronica.

“La metrica è la densità di calcolo. Se si eseguono operazioni di vettore o matrice con la fotonica, non è necessario utilizzare dispositivi core densi: con la maggiore velocità si può utilizzare l’hardware in modo ricorsivo”, afferma Bhavin Shastri, professore assistente presso l’Università della Regina.

Un problema potenzialmente più problematico per le reti neurali fotoniche risiede nella necessità di comportamenti non lineari negli algoritmi di intelligenza artificiale. La maggior parte dei componenti fotoniciconvenzionali funziona interamente in modo lineare e manca della flessibilità dei transistor che possono operare in regioni lineari e non lineari.

“Le interazioni non lineari diventano molto impegnative. È necessario utilizzare nuovi materiali per migliorare le non linearità o passare alla conversione ottica-elettronica-ottica, e questo deve essere fatto in modo molto efficiente”, afferma Shastri. Oggi, il ritardo nella conversione elettro-ottica riduce il vantaggio teorico di throughput dell’IA fotonica.

Ríos Ocampo sottolinea che gli operatori del fabbricante di semiconduttori che potrebbero costruire i necessari chip di fotonica al silicio sono restii ad introdurre nuovi materiali nei loro processi senza un grande stimolo di mercato. L’elaborazione fotonica deve ancora fornire la necessaria domanda. Un aiuto potrebbe venire dall’esperienza acquisita dalle aziende di semiconduttori nel loro lavoro decennale su memorie a cambiamento di fase elettroniche. Ciò potrebbe assistere lo sviluppo di memorie fotoniche non volatili e di altri componenti utili in questi sistemi, anche se la maggior parte del focus nei semiconduttori è stato su composti che assorbono la luce. I materiali trasparenti che possono essere utilizzati per manipolare solo la fase avrebbero bisogno di molti più test per la compatibilità con l’attrezzatura del fabbricante di semiconduttori.

Nonostante l’IA fotonica sia ancora in una fase iniziale della sua evoluzione, diverse startup hanno intrapreso piani per costruire acceleratori fotonicicommerciali, approfittando dei miglioramenti nella fotonica al silicio finora realizzati, principalmente in risposta alle esigenze del settore delle reti e delle comunicazioni. Il throughput delle comunicazioni rimane un focus chiave anche nel mondo dell’IA. Tra il piccolo gruppo di startup, Lightmatter sta lavorando sia su un acceleratore fotonicosia su una tecnologia di interconnessione ottica che può essere utilizzata per migliorare la velocità delle comunicazioni tra i moduli elettronici.

Luminous Computing aveva originariamente pianificato di costruire il proprio sistema di IA fotonica, ma l’azienda ha optato per concentrarsi su un acceleratore elettronico supportato da un’interconnessione fotonica di propria progettazione.

Il presidente di Luminous, Michael Hochberg, afferma di aver esaminato le opzioni per un nucleo fotonicoe di aver concluso che “i colli di bottiglia che stavano impedendo miglioramenti drammatici erano altrove nel sistema.”

Un futuro più luminoso per l’IA fotonica completa potrebbe risiedere al di fuori dei sistemi dei datacenter, come quelli costruiti da Lightmatter e Luminous. “Questa altra comunità sta guardando alle applicazioni in cui l’elettronica ha sfide fondamentali”, afferma Shastri. “Ci sono alcune cose che non si possono semplicemente scaricare su un data center. La domanda diventa quindi: Quali sono quelle attività?”

Sebbene la tendenza sia stata di breve durata all’epoca, il motore di ricerca della ricerca sui router solo ottici alla fine degli anni ’90 era la convinzione che sarebbe stato più facile indirizzare i pacchetti alla velocità di linea mantenendo i dati nel dominio fotonicosenza subire la conversione elettro-ottica e digitale-analogica. Ci sono numerose possibili applicazioni in cui le uscite dei sensori possono essere prese e utilizzate direttamente senza dover passare attraverso la conversione analogico-digitale, a differenza dei sistemi dei datacenter che lavorano sui dati archiviati.

Shastri fa riferimento al recente lavoro sull’utilizzo dell’elaborazione fotonica analogica per separare le trasmissioni radio. “È una forma del problema del cocktail-party: in uno spettro radio affollato è necessario trovare e concentrarsi su un solo segnale e utilizzare modi intelligenti di elaborazione. Non si può semplicemente utilizzare il filtraggio. La larghezza di banda dell’elettronica è limitata e la scalabilità dell’energia se si utilizza l’elaborazione elettronica può crescere quadraticamente a seconda del numero di canali o antenne. Abbiamo dimostrato che si può elaborare a larghezze di banda molto elevate. E l’energia si scala linearmente.”

“Ci sono alcune cose che non si possono semplicemente scaricare su un data center. La domanda diventa quindi: Quali sono quelle attività?”

Un’altra possibile applicazione si trova nei compiti di ottimizzazione, nonché nel controllo predittivo e nella stabilizzazione per veicoli veloci, come gli aeromobili ipersonici. “Dove è necessario convergere rapidamente verso una soluzione, la fotonica può avere un vantaggio.”

Anche se molto dipende dalla capacità di integrare più tecnologie in modo economico, la massiccia domanda di intelligenza dei dati in una gamma crescente di applicazioni potrebbe fornire alla fotonic computing le condizioni necessarie per evitare un altro inverno di R & D.

Lettura ulteriore

Huang, C. et al. Prospettive e applicazioni delle reti neurali fotoniche Advances in Physics: X, 7:1, 1981155 (2021)

Nahmias, M.A, Ferreira de Lima, T., Tait, A.N., Peng, H.-T., Shastri, B.J, e Prucnal, P.R. Operazioni di moltiplicazione-accumulo fotoniche per reti neurali IEEE Journal of Selected Topics in Quantum Electronics, Volume 26, Issue 1 (2020)

Ríos Ocampo, C.A. et al. Ultra-Compact Nonvolatile Photonics Basato su materiali trasparenti a cambiamento di fase riprogrammabili elettricamente PhotoniX, 3:26 (2022)

Tait, A.N. Quantificazione della potenza nelle reti neurali fotoniche in silicio Physical Review Applied 17, 054029 (2022)

Torna in alto

Autore

Chris Edwards è un giornalista con sede a Surrey, nel Regno Unito, che si occupa di elettronica, IT e biologia sintetica.

©2023 ACM 0001-0782/23/7

È concessa l’autorizzazione a copiare digitalmente o su carta parte o la totalità di questo lavoro per uso personale o in classe senza alcuna spesa a condizione che le copie non siano fatte o distribuite per lucro o vantaggio commerciale e che le copie rechino questa notifica e la citazione completa sulla prima pagina. Devono essere rispettati i diritti d’autore per i componenti di questo lavoro di proprietà di altri che ACM. L’astrazione con accredito è permessa. Per copiare diversamente, ripubblicare, postare su server o ridistribuire a elenchi, è necessario il permesso specifico e/o il corrispettivo. Richiedere il permesso di pubblicazione a [email protected] o al fax (212) 869-0481.

La Digital Library è pubblicata dall’Association for Computing Machinery. Copyright © 2023 ACM, Inc.