Apprendimento intuitivo della fisica in un modello di deep-learning ispirato alla psicologia dello sviluppo
'Apprendimento intuitivo della fisica tramite un modello di deep-learning ispirato alla psicologia dello sviluppo.'
Comprendere il mondo fisico è una competenza fondamentale che la maggior parte delle persone utilizza senza sforzo. Tuttavia, questo rappresenta ancora una sfida per l’intelligenza artificiale; se vogliamo utilizzare sistemi sicuri e utili nel mondo reale, vogliamo che questi modelli condividano il nostro senso intuitivo della fisica. Ma prima di poter costruire quei modelli, c’è un’altra sfida: come misureremo la capacità di questi modelli di comprendere il mondo fisico? Cioè, cosa significa comprendere il mondo fisico e come possiamo quantificarlo?
Fortunatamente per noi, gli psicologi dello sviluppo hanno trascorso decenni studiando ciò che i neonati sanno sul mondo fisico. Lungo il cammino, hanno trasformato la vaga nozione di conoscenza fisica in un insieme concreto di concetti fisici. E hanno sviluppato il paradigma della violazione delle aspettative (VoE) per testare quei concetti nei neonati.
Nel nostro articolo pubblicato oggi su Nature Human Behavior, abbiamo esteso il loro lavoro e reso pubblici i dati del dataset Physical Concepts. Questo dataset video sintetico porta il paradigma VoE per valutare cinque concetti fisici: solidità, persistenza degli oggetti, continuità, “immutabilità” e inerzia direzionale.
Con un punto di riferimento per la conoscenza fisica a portata di mano, ci siamo dedicati al compito di costruire un modello in grado di apprendere sul mondo fisico. Ancora una volta, abbiamo cercato ispirazione negli psicologi dello sviluppo. I ricercatori non solo hanno catalogato ciò che i neonati sanno sul mondo fisico, ma hanno anche ipotizzato i meccanismi che potrebbero consentire questo comportamento. Nonostante la variabilità, queste descrizioni hanno un ruolo centrale per la nozione di suddividere il mondo fisico in un insieme di oggetti che si evolvono nel tempo.
- Lavorare insieme a YouTube
- La più recente ricerca di DeepMind a ICML 2022
- Perceiver AR generazione autoregressiva a lungo contesto a uso generale
Ispirandoci a questo lavoro, abbiamo costruito un sistema che chiamiamo PLATO (Physics Learning through Auto-encoding and Tracking Objects). PLATO rappresenta e ragiona sul mondo come un insieme di oggetti. Fa previsioni su dove si troveranno gli oggetti in futuro in base a dove sono stati in passato e con quali altri oggetti interagiscono.
Dopo aver addestrato PLATO su video di interazioni fisiche semplici, abbiamo scoperto che PLATO ha superato i test nel nostro dataset Physical Concepts. Inoltre, abbiamo addestrato modelli “piani” che erano grandi (o anche più grandi) di PLATO ma non utilizzavano rappresentazioni basate sugli oggetti. Quando abbiamo testato questi modelli, abbiamo scoperto che non superavano tutti i nostri test. Ciò suggerisce che gli oggetti siano utili per apprendere la fisica intuitiva, supportando le ipotesi della letteratura sullo sviluppo.
Volevamo anche determinare quanto esperienza fosse necessaria per sviluppare questa capacità. L’evidenza della conoscenza fisica è stata dimostrata in neonati di soli due mesi e mezzo di età. Come se la cavava PLATO in confronto? Variando la quantità di dati di addestramento utilizzata da PLATO, abbiamo scoperto che PLATO poteva imparare i nostri concetti fisici con soli 28 ore di esperienza visiva. La natura limitata e sintetica del nostro dataset significa che non possiamo fare un confronto diretto tra la quantità di esperienze visive ricevute dai neonati e PLATO. Tuttavia, questo risultato suggerisce che la fisica intuitiva può essere appresa con una relativa poca esperienza se supportata da un bias induttivo per rappresentare il mondo come oggetti.
Infine, volevamo testare la capacità di PLATO di generalizzare. Nel dataset Physical Concepts, tutti gli oggetti nel nostro set di test sono anche presenti nel set di addestramento. Cosa succede se testiamo PLATO con oggetti che non ha mai visto prima? Per fare ciò, abbiamo sfruttato un sottoinsieme di un altro dataset sintetico sviluppato dai ricercatori dell’MIT. Questo dataset esplora anche la conoscenza fisica, sebbene con aspetti visivi diversi e un insieme di oggetti che PLATO non ha mai visto prima. PLATO ha superato il test, senza alcun ri-addestramento, nonostante sia stato testato su stimoli completamente nuovi.
Speriamo che questo dataset possa fornire ai ricercatori una comprensione più specifica delle capacità del loro modello nel comprendere il mondo fisico. In futuro, ciò potrà essere ampliato per testare più aspetti della fisica intuitiva aumentando l’elenco dei concetti fisici testati e utilizzando stimoli visivi più ricchi, inclusi nuove forme di oggetti o addirittura video del mondo reale.