Questa ricerca sull’IA del MIT dimostra come un sistema di apprendimento automatico basato sulla luce potrebbe produrre modelli di linguaggio più potenti ed efficienti

La ricerca del MIT dimostra che l'IA basata sulla luce può migliorare i modelli di linguaggio.

Le Reti Neurali Profonde (DNN) sono come super cervelli per i computer. Sono bravi a capire cose complicate da molte informazioni. Consentono ai computer di essere abbastanza intelligenti da capire le immagini, parlare come gli esseri umani, guidare auto da soli e persino aiutare i medici a individuare le malattie.

Le DNN copiano il funzionamento del nostro cervello, rendendole efficienti nel risolvere problemi difficili con cui i normali programmi informatici faticano. Tuttavia, le attuali tecnologie digitali che sottostanno alle Reti Neurali Profonde (DNN) di oggi si trovano ai limiti delle loro capacità, mentre il campo dell’apprendimento automatico continua a espandersi. Inoltre, queste tecnologie richiedono un consumo energetico massiccio e sono limitate ai centri di dati estesi. Questa situazione ispira la scoperta e la creazione di nuovi approcci informatici.

Come risultato, i ricercatori del MIT hanno dedicato sforzi estesi per migliorare questa situazione. Un team guidato dal MIT ha ingegnosamente ideato un sistema con il potenziale per superare le capacità del programma di apprendimento automatico che guida ChatGPT di diversi livelli. Questo nuovo sistema appositamente creato ha anche il notevole vantaggio di consumare significativamente meno energia rispetto ai supercomputer all’avanguardia che guidano i modelli di apprendimento automatico moderni. Questo sistema ha riportato un miglioramento di oltre 100 volte in termini di efficienza energetica e un miglioramento di 25 volte nella densità di calcolo. I suoi calcoli si basano sulla manipolazione della luce anziché degli elettroni, ottenuta attraverso centinaia di laser a scala micron.

I ricercatori hanno sottolineato che la tecnica ha aperto una strada per i processori optoelettronici su larga scala per accelerare le attività di apprendimento automatico dai centri di dati ai dispositivi periferici decentralizzati. In altre parole, i telefoni cellulari e altri dispositivi di piccole dimensioni potrebbero diventare in grado di eseguire programmi che attualmente possono essere calcolati solo nei grandi centri di dati. I calcoli ottici consumano significativamente meno energia rispetto ai loro equivalenti elettronici. La luce può trasmettere una quantità molto maggiore di informazioni in uno spazio considerevolmente più piccolo.

Dirk Englund, professore associato al Dipartimento di Ingegneria Elettrica e Informatica del MIT e leader di questa iniziativa, afferma che le capacità dei supercomputer attuali limitano le dimensioni di ChatGPT. La praticità di addestrare modelli molto più grandi è limitata da fattori economici. La tecnologia che hanno sviluppato può consentire l’utilizzo di modelli di apprendimento automatico altrimenti inaccessibili nei prossimi anni. Ha inoltre affermato che stanno ancora valutando le capacità che avrà la prossima generazione di ChatGPT se sarà 100 volte più potente, ma è questo il campo di scoperta che questo tipo di tecnologia può consentire.

Nonostante i vantaggi delle reti neurali ottiche, le attuali reti neurali ottiche (ONN) presentano anche notevoli sfide. Ad esempio, richiedono molta energia in quanto sono inefficienti nel convertire i dati in ingresso in luce basandosi sulla potenza elettrica. Inoltre, i componenti necessari per queste operazioni sono di grandi dimensioni e occupano uno spazio considerevole. Nonostante siano competenti nei calcoli lineari come l’addizione, le reti neurali optoelettroniche (ONN) affrontano limitazioni quando si tratta di calcoli non lineari come la moltiplicazione e le istruzioni condizionali.

Consulta l’articolo e il blog del MIT. Tutti i crediti di questa ricerca vanno ai ricercatori di questo progetto. Inoltre, non dimenticare di unirti alla nostra comunità di oltre 29.000 membri su ML SubReddit, oltre 40.000 su Facebook, al canale Discord e alla nostra newsletter via email, dove condividiamo le ultime notizie sulla ricerca di intelligenza artificiale, progetti interessanti di intelligenza artificiale e altro ancora.

 Hostinger AI Website Builder: Editor trascinabile e facile da usare. Provalo ora (sponsorizzato)

L’articolo Questa ricerca sull’IA del MIT dimostra come un sistema di apprendimento automatico basato sulla luce potrebbe produrre modelli di linguaggio più potenti ed efficienti su larga scala è apparso per primo su MarkTechPost.