I ricercatori di Microsoft svelano ‘EmotionPrompt’ Migliorare l’intelligenza emotiva dell’IA attraverso diversi modelli di linguaggio.

The researchers of Microsoft unveil 'EmotionPrompt' enhancing AI's emotional intelligence through various language models.

L’intelligenza emotiva è una pietra angolare storicamente posizionata nell’ampio mosaico delle qualità umane. La comprensione emotiva è la capacità di riconoscere e elaborare correttamente i dati emotivi e poi utilizzare tali dati per guidare processi logici e analitici come la risoluzione dei problemi e la gestione comportamentale. Riflessi, percezione, cognizione e comportamento danno origine alle emozioni, e vari fattori interni ed esterni possono influenzare questi componenti. L’autoregolazione, la teoria cognitiva sociale e l’importanza delle emozioni positive indicano che il controllo delle emozioni può influenzare le capacità umane di risoluzione dei problemi. A causa degli effetti diversificati che ha sulle persone, la teoria della regolazione emotiva è stata utilizzata in campi tanto diversi come l’educazione e la salute.

Nuove ricerche condotte da CAS, Microsoft, William & Mary, Beijing Normal University e HKUST indagano la connessione tra EQ e sofisticati modelli di IA. I nuovi linguaggi modelli di grandi dimensione (LLM) hanno dimostrato prestazioni impressionanti in diverse attività, tra cui ragionamento, elaborazione e generazione del linguaggio naturale e risoluzione dei problemi STEM, rendendoli uno degli sforzi di ricerca più promettenti verso l’intelligenza artificiale generale. Consentendo a GPT-4 di svolgere diversi compiti difficili ideati dagli esseri umani, uno studio recente ha suggerito che i LLM mostrano un notevole potenziale verso AGI. Tuttavia, è ancora sconosciuto se i LLM possono interpretare impulsi emotivi psicologici, un beneficio fondamentale degli esseri umani che li aiuta a migliorare le loro capacità di risolvere i problemi. Utilizzando metodi di apprendimento contestuale, molti accademici hanno compiuto grandi passi in diverse aree. Tuttavia, date le differenze nelle loro capacità, non tutti i LLM beneficeranno allo stesso modo dei metodi attualmente disponibili. Mentre ricerche recenti hanno dimostrato che i LLM possono riconoscere ed elaborare segnali emotivi, questo studio non ha valutato se l’intelligenza emotiva dei LLM influisce in maniera significativa sul miglioramento delle loro prestazioni.

Questo nuovo studio compie il primo passo nell’indagine sul potenziale dei LLM nel comprendere ed utilizzare gli stimoli emotivi. Segnali emotivi associati alla speranza, all’autostima e all’approvazione tra pari sono stati dimostrati avere un effetto positivo nelle precedenti ricerche psicologiche. Applicazioni del mondo reale di questo fenomeno comprendono un linguaggio incoraggiante per migliorare le performance accademiche e aumentare il benessere fisico. I ricercatori si sono ispirati a questi processi psicologici e hanno presentato EmotionPrompt, un metodo semplice ma potente per indagare l’intelligenza emotiva dei LLM. In particolare, hanno progettato 11 affermazioni come frasi psicologiche da utilizzare come prompt di continuazione per i LLM al fine di suscitare una risposta emotiva.

Sia compiti deterministici che generativi, che insieme comprendono una vasta gamma di livelli di difficoltà, vengono utilizzati nelle loro approfondite indagini. Hanno condotto prove con vari LLM, come FlanT5-Large, Vicuna, Llama 2, BLOOM, ChatGPT e GPT-4, su 24 compiti di induzione delle istruzioni e 21 compiti selezionati di BIG-Bench, tutti deterministici e valutabili con metriche comuni. Hanno condotto uno studio umano con 106 partecipanti per valutare la qualità della generazione di compiti utilizzando sia prompt vanilla che emotivi basati su GPT-4, poiché queste attività non si prestano all’evaluazione tradizionale e automatica. Lo studio umano mostra che i prompt emotivi migliorano significativamente le prestazioni dei compiti generativi (con un miglioramento medio del 10,9% sulle metriche di veridicità e responsabilità). D’altra parte, gli esperimenti standard mostrano che i LLM possiedono intelligenza emotiva e possono essere potenziati attraverso stimoli emotivi.

I ricercatori hanno anche analizzato perché EmotionPrompt sia utile per i LLM valutando gli effetti degli stimoli emotivi sugli output finali attraverso l’attenzione in input. I risultati mostrano che i gradienti nei LLM traggono vantaggio dagli stimoli emotivi, attribuendo loro un maggior peso, il che beneficia i risultati migliorando la rappresentazione degli stimoli originali. Per saperne di più su come la dimensione del modello e la temperatura influenzano l’efficacia di EmotionPrompt, hanno condotto uno studio di ablazione.

Infine, hanno esaminato come l’uso di molti segnali emotivi insieme influisca sulle prestazioni e hanno scoperto che ciò può migliorare significativamente i risultati. Sulla base dei risultati, il EP02 è lo stimolo migliore per l’induzione delle istruzioni, superando lo stimolo peggiore del 6,06 percento, mentre l’EP06 è lo stimolo migliore per BIG-Bench. È importante ricordare che diversi fattori, come la complessità del compito, il tipo di compito e le metriche utilizzate, possono influenzare le prestazioni di uno stimolo.