La più recente ricerca di DeepMind a ICML 2022

Ultima ricerca di DeepMind a ICML 2022.

Aprire la strada a sistemi generalizzati con intelligenza artificiale più efficace ed efficiente

A partire da questo fine settimana, il trentanovesimo Convegno Internazionale sul Machine Learning (ICML 2022) si terrà dal 17 al 23 luglio 2022 presso il Baltimore Convention Center in Maryland, USA, e si svolgerà come evento ibrido.

I ricercatori che lavorano nel campo dell’intelligenza artificiale, della scienza dei dati, della visione artificiale, della biologia computazionale, del riconoscimento vocale e altro ancora presenteranno e pubblicheranno i loro lavori all’avanguardia nel machine learning.

Oltre a sponsorizzare la conferenza e sostenere workshop e incontri sociali organizzati dai nostri partner di lunga data LatinX, Black in AI, Queer in AI e Women in Machine Learning, i nostri team di ricerca presenteranno 30 articoli, di cui 17 collaborazioni esterne. Ecco una breve introduzione alle nostre presentazioni orali e in primo piano in arrivo:

Apprendimento rinforzato efficace

Rendere gli algoritmi di apprendimento rinforzato (RL) più efficaci è fondamentale per costruire sistemi di intelligenza artificiale generalizzati. Ciò include aiutare ad aumentare l’accuratezza e la velocità delle prestazioni, migliorare il trasferimento e l’apprendimento a zero shot e ridurre i costi computazionali.

In una delle nostre presentazioni orali selezionate, mostriamo un nuovo modo di applicare il miglioramento generalizzato delle politiche (GPI) su composizioni di politiche che rende ancora più efficace il miglioramento delle prestazioni di un agente. Un’altra presentazione orale propone un nuovo modo fondato ed efficiente per esplorare senza la necessità di bonus. Parallelamente, proponiamo un metodo per potenziare un agente RL con un processo di recupero basato sulla memoria, riducendo la dipendenza dell’agente dalla capacità del suo modello e consentendo un uso rapido e flessibile delle esperienze passate.

Progressi nei modelli di linguaggio

Il linguaggio è una parte fondamentale dell’essere umano. Conferisce alle persone la capacità di comunicare pensieri e concetti, creare ricordi e costruire una comprensione reciproca. Lo studio degli aspetti del linguaggio è fondamentale per comprendere come funziona l’intelligenza, sia nei sistemi di intelligenza artificiale che negli esseri umani.

La nostra presentazione orale sulle leggi di scala unificate e il nostro articolo sul recupero esplorano entrambi come potremmo costruire modelli di linguaggio più grandi in modo più efficiente. Analizzando modi per costruire modelli di linguaggio più efficaci, introduciamo un nuovo set di dati e un benchmark con StreamingQA che valuta come i modelli si adattano e dimenticano nuove conoscenze nel tempo, mentre il nostro articolo sulla generazione narrativa mostra come i modelli di linguaggio preaddestrati attuali abbiano ancora difficoltà nella creazione di testi più lunghi a causa delle limitazioni di memoria a breve termine.

Ragionamento algoritmico

Il ragionamento algoritmico neurale è l’arte di costruire reti neurali in grado di eseguire calcoli algoritmici. Questa area di ricerca in rapida crescita ha un grande potenziale nel contribuire ad adattare algoritmi conosciuti a problemi del mondo reale.

Introduciamo il benchmark CLRS per il ragionamento algoritmico, che valuta le reti neurali nell’esecuzione di un insieme diversificato di trenta algoritmi classici tratti dal libro “Introduzione agli algoritmi”. Allo stesso modo, proponiamo un algoritmo di apprendimento incrementale generale che adatta il replay di esperienza in base a risultati a posteriori alla dimostrazione automatizzata di teoremi, uno strumento importante per aiutare i matematici a dimostrare teoremi complessi. Inoltre, presentiamo un framework per la simulazione basata su vincoli appresi, mostrando come i metodi di simulazione tradizionali e i metodi numerici possano essere utilizzati nei simulatori di apprendimento automatico, una nuova direzione significativa per la soluzione di problemi complessi di simulazione in scienza e ingegneria.

Vedi l’intera gamma dei nostri lavori a ICML 2022 qui.