I ricercatori di Stanford decifrano il codice della visione naturale mentre il nuovo modello rivela come gli occhi decodificano la scena visiva

Stanford researchers decipher the code of natural vision as the new model reveals how eyes decode the visual scene.

Un obiettivo fondamentale nel campo delle neuroscienze sensoriali è capire i meccanismi complessi che sottostanno al codice neurale responsabile del processo delle scene visive naturali. In neuroscienze, una domanda fondamentale ma ancora irrisolta è come si sviluppano i circuiti neurali in contesti naturali attraverso l’interazione di più tipi di cellule. Gli occhi si sono evoluti per comunicare informazioni sulle scene visive naturali utilizzando una vasta gamma di interneuroni, che è cruciale per trasmettere informazioni visive al cervello.

Il funzionamento della retina si basa principalmente sulla ricerca su come reagisce agli stimoli artificiali come luci intermittenti e rumore. Questi potrebbero non rappresentare accuratamente come la retina interpreta i dati visivi effettivi. Nonostante siano stati rilevati diversi calcoli utilizzando tali metodi, la complessità di come più di 50 diversi tipi di interneuroni contribuiscono all’elaborazione retinica deve ancora essere pienamente compresa. In un recente articolo di ricerca, un gruppo di ricercatori ha compiuto un significativo avanzamento mostrando che un modello di rete a tre strati è in grado di predire le risposte retiniche a paesaggi naturali con una precisione sorprendente, quasi oltrepassando i limiti dei dati sperimentali. I ricercatori volevano capire come il cervello elabora le scene visive naturali, quindi si sono concentrati sulla retina, che è parte dell’occhio che invia segnali al cervello.

L’interpretabilità di questo modello, cioè la capacità di comprendere ed esaminare la sua organizzazione interna, è una delle sue caratteristiche chiave. C’è una forte correlazione tra le risposte degli interneuroni che sono stati direttamente inclusi nel modello e quelli che sono stati registrati separatamente. Questo suggerisce che il modello cattura aspetti significativi dell’attività degli interneuroni retinici. Riproduce con successo una vasta gamma di analisi del movimento, adattabilità e fenomeni di codifica predittiva quando vengono addestrati solo su scene naturali. D’altra parte, i modelli addestrati su rumore bianco non possono riprodurre lo stesso insieme di eventi, supportando l’idea che l’analisi di scenari naturali sia necessaria per comprendere l’elaborazione visiva naturale.

I calcoli effettuati dalle cellule gangliari del modello sono stati suddivisi nei contributi individuali degli interneuroni del modello utilizzando una metodologia presentata dal team. Con questo approccio, è possibile generare automaticamente nuove teorie sull’interazione degli interneuroni con diversi modelli di risposta spaziotemporale per produrre calcoli retinici, che chiariscono le occorrenze di previsione.

Per le sequenze di immagini naturali, le immagini sono state sottoposte a jittering a un tasso di 30 fotogrammi al secondo, modifiche ogni secondo e un modello di movimento casuale che imitava i dati di movimento oculari fissazionali. Questo metodo ha prodotto uno stimolo spaziotemporale più simile all’ambiente in cui funziona la retina.

In conclusione, il team ha scoperto che tre strati di elaborazione neurale, simili alla struttura retinica, erano cruciali per replicare risposte accurate. Questo modello ha previsto con successo come le vere cellule gangliari retiniche hanno reagito a immagini naturali e rumore casuale. Il modello accuratamente progettato con strati specifici ha emulato con precisione il comportamento di queste cellule. Pertanto, la ricerca consente di comprendere come il sistema visivo interpreta il mondo, offrendo approfondimenti sui processi complessi che regolano la visione naturale.