Un nuovo studio di intelligenza artificiale dell’MIT mostra come le reti neurali profonde non vedano il mondo nel modo in cui lo vediamo noi

Uno studio innovativo dell'intelligenza artificiale dell'MIT svela come le reti neurali profonde percepano il mondo in modo diverso da noi

Nella ricerca della replicazione dei complessi meccanismi dei sistemi sensoriali umani, i ricercatori nel campo delle neuroscienze e dell’intelligenza artificiale si trovano ad affrontare una sfida persistente: la disparità delle invarianze tra modelli computazionali e percezione umana. Come evidenziato in studi recenti, inclusa una condotta da un gruppo di scienziati, le reti neurali artificiali progettate per imitare le varie funzioni del sistema visivo e uditivo umano spesso manifestano invarianze non allineate con quelle presenti nella percezione sensoriale umana. Questa contraddizione solleva interrogativi sui principi guida alla base dello sviluppo di questi modelli e la loro applicabilità in scenari reali.

Storicamente, i tentativi di affrontare il problema delle discrepanze di invarianza tra modelli computazionali e percezione umana hanno coinvolto l’indagine di aree come la vulnerabilità del modello alle perturbazioni avverse o l’impatto del rumore e delle traslazioni sui giudizi del modello.

Metamers del modello: il concetto di metamers del modello è ispirato ai metamers percettivi umani, che sono stimoli che, sebbene fisicamente distinti, producono risposte indistinguibili in certi stadi del sistema sensoriale. Nel contesto dei modelli computazionali, i metamers del modello sono stimoli sintetici con attivazioni quasi identiche in un modello rispetto a immagini o suoni naturali specifici. La domanda cruciale è se gli esseri umani riescano a riconoscere questi metamers del modello come appartenenti alla stessa classe dei segnali biologici a cui sono abbinati.

I risultati di questo studio gettano luce sulla significativa divergenza tra le invarianze presenti nei modelli computazionali e quelle nella percezione umana. Il team di ricerca ha generato metamers del modello da vari modelli di reti neurali profonde della visione e dell’udito, tra cui modelli di apprendimento supervisionato e non supervisionato. In una scoperta sorprendente, i metamers del modello prodotti nelle fasi finali di questi modelli erano costantemente irriconoscibili per gli osservatori umani. Ciò suggerisce che molte invarianze in questi modelli non sono condivise con il sistema sensoriale umano.

L’efficacia di questi metamers del modello nel mettere in luce le differenze tra modelli e esseri umani è ulteriormente dimostrata dalla loro prevedibilità. In modo interessante, il riconoscimento umano dei metamers del modello era fortemente correlato al loro riconoscimento da parte di altri modelli, suggerendo che la differenza tra esseri umani e modelli risiede nelle invarianze specifiche e idiosincratiche di ciascun modello.

In conclusione, l’introduzione dei metamers del modello rappresenta un passo significativo verso la comprensione e l’affronto delle disparità tra modelli computazionali di sistemi sensoriali e la percezione sensoriale umana. Questi stimoli sintetici offrono una nuova prospettiva sulle sfide dei ricercatori nel creare modelli più fedeli alla biologia. Sebbene vi sia ancora molto lavoro da fare, il concetto di metamers del modello fornisce un punto di riferimento promettente per la valutazione futura dei modelli e il potenziale per migliorare i sistemi artificiali che si allineano meglio alle complessità della percezione sensoriale umana.