In conversazione con l’IA costruire modelli di linguaggio migliori

'Conversazione con l'IA per modelli di linguaggio migliori'

Nuove ricerche, basandosi sulla pragmatica e sulla filosofia, propongono modi per allineare gli agenti di conversazione ai valori umani

Il linguaggio è una caratteristica essenziale dell’essere umano e il principale mezzo con cui comunichiamo informazioni, compresi pensieri, intenzioni e sentimenti. I recenti progressi nella ricerca sull’IA hanno portato alla creazione di agenti di conversazione in grado di comunicare con gli esseri umani in modi sfumati. Questi agenti sono alimentati da grandi modelli di linguaggio, sistemi informatici addestrati su vasti corpora di materiali basati su testo per predire e produrre testo utilizzando tecniche statistiche avanzate.

Tuttavia, mentre modelli di linguaggio come InstructGPT, Gopher e LaMDA hanno raggiunto livelli record di prestazioni in compiti come la traduzione, la risposta alle domande e la comprensione della lettura, questi modelli hanno anche dimostrato di presentare una serie di rischi potenziali e modalità di fallimento. Questi includono la produzione di linguaggio tossico o discriminatorio e informazioni false o fuorvianti [1, 2, 3].

Questi difetti limitano l’uso produttivo degli agenti di conversazione in contesti applicativi e attirano l’attenzione sul modo in cui questi agenti non soddisfano determinati ideali comunicativi. Fino ad oggi, la maggior parte degli approcci all’allineamento degli agenti di conversazione si è concentrata sulla previsione e riduzione dei rischi [4].

Il nostro nuovo articolo, In conversation with AI: allineare i modelli di linguaggio ai valori umani, adotta un approccio diverso, esplorando come potrebbe apparire una comunicazione di successo tra un essere umano e un agente di conversazione artificiale e quali valori dovrebbero guidare queste interazioni in diversi ambiti conversazionali.

Spunti dalla pragmatica

Per affrontare queste problematiche, l’articolo si basa sulla pragmatica, una tradizione nella linguistica e nella filosofia, che sostiene che lo scopo di una conversazione, il suo contesto e un insieme di norme correlate costituiscano una parte essenziale della pratica conversazionale corretta.

Modellando la conversazione come un impegno collaborativo tra due o più parti, il linguista e filosofo Paul Grice sosteneva che i partecipanti dovrebbero:

  • Parlare in modo informativo
  • Dire la verità
  • Fornire informazioni pertinenti
  • Evitare affermazioni oscure o ambigue

Tuttavia, il nostro articolo dimostra che è necessario affinare ulteriormente questi massimi prima che possano essere utilizzati per valutare gli agenti di conversazione, data la variazione negli obiettivi e nei valori incorporati in diversi ambiti conversazionali.

Ideali discorsivi

A titolo di esempio, l’indagine scientifica e la comunicazione sono principalmente indirizzate alla comprensione o alla previsione dei fenomeni empirici. Date queste finalità, un agente di conversazione progettato per assistere l’indagine scientifica dovrebbe idealmente fare solo affermazioni il cui verificarsi è confermato da sufficienti prove empiriche, o in caso contrario qualificare le sue posizioni in base a intervalli di confidenza pertinenti.

Ad esempio, un agente che riferisce che “A una distanza di 4,246 anni luce, Proxima Centauri è la stella più vicina alla Terra”, dovrebbe farlo solo dopo che il modello su cui si basa ha verificato che l’affermazione corrisponda ai fatti.

Tuttavia, un agente di conversazione che svolge il ruolo di moderatore in un discorso politico pubblico potrebbe dover dimostrare virtù molto diverse. In questo contesto, l’obiettivo è principalmente gestire le differenze e favorire la cooperazione produttiva nella vita di una comunità. Pertanto, l’agente dovrà porre in primo piano i valori democratici di tolleranza, civiltà e rispetto [5].

Inoltre, questi valori spiegano perché la generazione di discorsi tossici o pregiudizievoli da parte dei modelli di linguaggio è spesso così problematica: il linguaggio offensivo non comunica un uguale rispetto per i partecipanti alla conversazione, cosa che è un valore chiave per il contesto in cui i modelli vengono utilizzati. Allo stesso tempo, le virtù scientifiche, come la presentazione esaustiva dei dati empirici, possono essere meno importanti nel contesto della deliberazione pubblica.

Infine, nel campo della narrazione creativa, lo scambio comunicativo mira alla novità e all’originalità, valori che differiscono significativamente da quelli delineati in precedenza. In questo contesto, una maggiore libertà con il fare-credere può essere appropriata, anche se rimane importante tutelare le comunità da contenuti maliziosi prodotti sotto mentite spoglie di “uso creativo”.

Strade future

Questa ricerca ha diverse implicazioni pratiche per lo sviluppo di agenti di IA di conversazione allineati. Per iniziare, essi dovranno incarnare tratti diversi a seconda dei contesti in cui vengono utilizzati: non esiste un approccio universale per l’allineamento dei modelli di linguaggio. Invece, la modalità appropriata e gli standard valutativi per un agente, inclusi gli standard di veridicità, varieranno in base al contesto e allo scopo di uno scambio conversazionale.

Inoltre, gli agenti di conversazione potrebbero anche avere il potenziale per coltivare conversazioni più solide e rispettose nel tempo, attraverso un processo che chiamiamo costruzione ed elucitazione del contesto. Anche quando una persona non è consapevole dei valori che regolano una determinata pratica conversazionale, l’agente può comunque aiutare l’essere umano a comprendere questi valori prefigurandoli nella conversazione, rendendo il corso della comunicazione più profondo e fruttuoso per il parlante umano.