I ricercatori di Meta AI presentano un modello di apprendimento automatico che esplora la decodifica della percezione del linguaggio parlato da registrazioni cerebrali non invasive.

Ricercatori di Meta AI presentano un modello di apprendimento automatico per decodificare la percezione del linguaggio parlato attraverso registrazioni cerebrali non invasive

Svelare il discorso dall’attività cerebrale, un obiettivo di lunga data nella sanità e nella neuroscienze, ha recentemente visto progressi con dispositivi invasivi. Gli algoritmi di deep learning addestrati su registrazioni intracraniche possono decodificare elementi linguistici di base. Tuttavia, estenderlo al discorso naturale e alle registrazioni cerebrali non invasive rappresenta una sfida. I ricercatori di Meta presentano un modello di apprendimento automatico che utilizza l’apprendimento contrastivo per decodificare le rappresentazioni del discorso percepito dalle registrazioni non invasive. Il loro metodo combina quattro set di dati e ottiene risultati promettenti, offrendo una possibile via per la decodifica del linguaggio dall’attività cerebrale senza procedure invasive, con implicazioni per la sanità e la neuroscienze.

I ricercatori esplorano la decodifica del discorso dalle registrazioni dell’attività cerebrale non invasive, basandosi sui successi recenti con dispositivi invasivi nella decodifica degli elementi linguistici. Il loro metodo introduce un modello di apprendimento contrastivo addestrato a decodificare le rappresentazioni autonome del discorso. Confronti con studi invasivi mettono in evidenza il loro vocabolario più ampio e si discutono le potenziali applicazioni nella produzione del discorso. Sono state ottenute approvazioni etiche per i set di dati di volontari adulti sani che coinvolgono l’ascolto passivo.

Decodificare il discorso dalle registrazioni cerebrali non invasive è una sfida significativa nella sanità e nelle neuroscienze. Mentre i dispositivi invasivi hanno fatto progressi, estendere questo al discorso naturale rimane difficile. Il loro approccio presenta un modello addestrato con apprendimento contrastivo per decodificare le rappresentazioni autonome del discorso dai dati non invasivi. Il loro avanzamento offre promesse nella decodifica del linguaggio dall’attività cerebrale senza procedure invasive.

Il loro metodo introduce un compito di decodifica neurale per decifrare il discorso percepito dalle registrazioni cerebrali non invasive. Il modello è addestrato e valutato utilizzando quattro set di dati pubblici con 175 volontari registrati tramite MEG o EEG mentre ascoltano storie. Utilizza un’architettura convoluzionale comune, addestrata contemporaneamente su più partecipanti. L’analisi comparativa con le basi sottolinea l’importanza dell’obiettivo contrastivo e delle rappresentazioni del discorso preaddestrate. Inoltre, le previsioni del decodificatore si basano principalmente su rappresentazioni semantiche lessicali e contestuali.

L’accuratezza della decodifica varia tra i partecipanti e i set di dati. Le previsioni a livello di parole mostrano un’identificazione accurata delle parole corrette e una discriminazione dai candidati negativi. I confronti con le basi sottolineano l’importanza dell’obiettivo contrastivo, delle rappresentazioni del discorso preaddestrate e di un’architettura convoluzionale condivisa nel migliorare l’accuratezza della decodifica. Le previsioni del decodificatore si basano principalmente su rappresentazioni semantiche lessicali e contestuali.

I ricercatori introducono un modello basato sull’apprendimento contrastivo per decodificare il discorso percepito dalle registrazioni cerebrali non invasive. Il loro modello mostra risultati promettenti, raggiungendo un’accuratezza media fino al 41% nell’identificazione del segmento del discorso e fino all’80% di accuratezza nei partecipanti con migliori performance. Il confronto con le basi sottolinea l’importanza degli obiettivi contrastivi, delle rappresentazioni del discorso preaddestrate e di un’architettura convoluzionale condivisa nel migliorare l’accuratezza della decodifica. Le previsioni del decodificatore si basano principalmente su semantica lessicale e contestuale. Il loro lavoro ha il potenziale per la decodifica del linguaggio non invasiva nelle applicazioni di sanità e neuroscienze.

Ricerche future dovrebbero chiarire i fattori che contribuiscono alle variazioni dell’accuratezza della decodifica tra i partecipanti e i set di dati. È essenziale indagare sulle prestazioni del modello nella risoluzione di attributi linguistici più complessi e in scenari di percezione del discorso in tempo reale. Valutare la capacità del modello di generalizzarsi a diverse tecniche di registrazione o imaging cerebrale è imperativo. Esplorare la sua capacità di catturare la prosodia e le caratteristiche fonetiche offrirebbe una comprensione completa della decodifica del discorso.