Questa ricerca sull’IA spiega i tratti di personalità sintetici nei modelli di linguaggio di grandi dimensioni (LLM).

Questa ricerca sull'IA spiega i tratti di personalità sintetici nei LLM di grandi dimensioni.

La personalità di un individuo consiste in una combinazione unica di qualità, caratteristiche e modi di pensare. Essa influenza le nostre interazioni sociali più fondamentali e le preferenze a causa delle nostre storie biologiche ed ambientali condivise. Grazie alla loro ampia esposizione ai dati generati dagli esseri umani durante l’addestramento, i LLM possono rappresentare in modo convincente personalità simili a quelle umane nei loro risultati e, di conseguenza, dimostrare una personalità sintetica.

Grazie alla loro ampia esposizione ai dati generati dagli esseri umani durante l’addestramento, i LLM possono rappresentare in modo convincente personalità simili a quelle umane nei loro risultati e, di conseguenza, dimostrare una personalità sintetica. Recenti ricerche hanno cercato di identificare le conseguenze indesiderate delle capacità migliorate dei LLM, come la tendenza a produrre linguaggio violento e la produzione di linguaggio ingannevole e manipolativo negli esperimenti. Le conversazioni, le spiegazioni e l’estrazione di conoscenza dai LLM non sono sempre affidabili.

Comprendere le proprietà legate ai tratti di personalità del linguaggio creato da questi modelli è fondamentale poiché i LLM diventano l’interfaccia dominante nell’interazione uomo-computer (HCI), così come imparare come ingegnerizzare in modo sicuro, appropriato ed efficace i profili di personalità generati dai LLM. I ricercatori hanno studiato metodi che includono la tecnica del “few-shot prompting” per ridurre l’impatto dei tratti di personalità negativi e gravi nei risultati dei LLM. Nonostante i LLM producano output molto variabili ed siano ipersensibili al prompting, finora non si è ancora affrontato come quantificare scientificamente e sistematicamente la loro personalità.

Ricercatori di Google DeepMind, dell’Università di Cambridge, di Google Research, dell’Università di Keio e dell’Università della California, Berkeley propongono approcci psicometrici rigorosi e verificati per caratterizzare e modellare le sintesi di personalità basate sui LLM.

Il team crea innanzitutto una metodologia per utilizzare test psicometrici già esistenti per stabilire la validità costruttiva della caratterizzazione delle personalità nella letteratura generata dai LLM. Essi presentano un nuovo approccio che imita la varianza della popolazione nelle risposte dei LLM attraverso il prompting controllato per testare le correlazioni statistiche tra la personalità e i suoi correlati esterni così come esistono nei dati delle scienze sociali umane. Infine, contribuiscono con un metodo per modellare la personalità che opera in modo indipendente dai LLM e produce cambiamenti osservabili nei livelli dei tratti.

I ricercatori testano l’approccio su LLM di diverse dimensioni e metodi di addestramento in due ambienti di interazione naturale: MCQA e generazione di testo a lungo termine. I risultati mostrano le seguenti osservazioni:

  1.  I LLM possono simulare in modo affidabile e validamente la personalità nei loro risultati (in determinate configurazioni di prompting).
  2. Le prove della validità e affidabilità della personalità simulata dai LLM sono più forti per modelli più grandi e addestrati con istruzioni specifiche.
  3. La personalità nei risultati dei LLM può essere modellata lungo dimensioni desiderate per imitare profili di personalità specifici.