Learn more about Technical blog

Esplorazione delle istituzioni per la governance globale dell’IA

Nuovo white paper indaga modelli e funzioni delle istituzioni internazionali che potrebbero aiutare a gestire opportu...

Abilitando la predizione di alta precisione della struttura delle proteine a livello del proteoma

Molte nuove innovazioni di apprendimento automatico contribuiscono al livello attuale di precisione di AlphaFold. For...

Acme Un nuovo framework per il reinforcement learning distribuito

Acme è un framework per la creazione di algoritmi di RL (Reinforcement Learning) leggibili, efficienti e orientati al...

dm_control Software e Compiti per il Controllo Continuo

Il pacchetto software dm_control è una collezione di librerie Python e suite di task per agenti di apprendimento per ...

RL Non Collegato Benchmark per l’Apprendimento Rinforzato Offline

Proponiamo un benchmark chiamato RL Unplugged per valutare e confrontare i metodi di RL offline. RL Unplugged include...

Utilizzando Unity per aiutare a risolvere l’intelligenza

Presentiamo il nostro utilizzo di Unity, un motore di gioco ampiamente riconosciuto e completo, per creare simulazion...

Imitando l’intelligenza interattiva

Prima creiamo un ambiente simulato, la Stanza dei Giochi, in cui i robot virtuali possono impegnarsi in una varietà d...

Dati, Architettura o Perdite Cosa Contribuisce di Più al Successo del Transformer Multimodale?

In questo lavoro, esaminiamo quali aspetti dei transformer multimodali - attenzione, perdite e dati di pretraining - ...

Melting Pot una suite di valutazione per l’apprendimento di rinforzo multi-agente

Qui presentiamo Melting Pot, una suite di valutazione scalabile per l'apprendimento di rinforzo multi-agente. Melting...

Sfide nel rendere atossici i modelli di linguaggio

Nel nostro articolo, ci concentriamo sugli LMs e sulla loro propensione a generare linguaggio tossico. Studiamo l'eff...

È la Curiosità tutto ciò di cui hai bisogno? Sull’utilità dei comportamenti emergenti derivanti dall’esplorazione curiosa

Sosteniamo che utilizzare semplicemente la curiosità per l'esplorazione rapida dell'ambiente o come ricompensa bonus ...

L’apprendimento profondo non supervisionato identifica lo sdoppiamento semantico nei singoli neuroni della patch facciale inferotemporale.

Il nostro cervello ha una straordinaria capacità di elaborare informazioni visive. Possiamo dare uno sguardo a una sc...

Sulla espressività del Markov Reward

I nostri principali risultati dimostrano che, sebbene la ricompensa possa esprimere molte attività, esistono istanze ...

Creazione di agenti interattivi con apprendimento per imitazione

Dimostriamo che l'apprendimento per imitazione delle interazioni umano-umane in un mondo simulato, in combinazione co...

Migliorare i modelli linguistici recuperando da trilioni di token

Esploriamo un percorso alternativo per migliorare i modelli linguistici arricchiamo i transformer con il recupero di ...