Articoli di ricerca sugli agenti generativi che dovresti leggere

Articoli di ricerca sugli ingredienti rigeneranti che dovresti assolutamente leggere

 

Generative Agents è un termine coniato dai ricercatori dell’Università di Stanford e di Google nel loro articolo chiamato Generative Agents: Interactive Simulacra of Human Behavior (Park et al., 2023). In questo articolo, la ricerca spiega che i Generative Agents sono software computazionali che simulano in modo credibile il comportamento umano. 

Nell’articolo, viene presentato come gli agenti possano agire come farebbero gli esseri umani: scrivendo, cucinando, parlando, votando, dormendo, ecc., implementando un modello generativo, in particolare il Large Language Model (LLM). Gli agenti possono dimostrare di avere la capacità di fare inferenze su se stessi, sugli altri agenti e sul loro ambiente sfruttando il modello del linguaggio naturale.

Il ricercatore costruisce un’architettura di sistema per memorizzare, sintetizzare e applicare ricordi pertinenti per generare comportamenti credibili utilizzando un grande modello di linguaggio, consentendo agli agenti generativi di esistere. Questo sistema è costituito da tre componenti:

  1. Memory stream. Il sistema registra le esperienze dell’agente e serve come riferimento per le azioni future dell’agente.
  2. Reflection. Il sistema sintetizza l’esperienza in ricordi per consentire all’agente di imparare e agire meglio.
  3. Planning. Il sistema traduce gli insight del sistema precedente in piani d’azione di alto livello e consente all’agente di reagire all’ambiente.

Questi sistemi di riflessione e di pianificazione lavorano sinergicamente con il flusso di memoria per influenzare il comportamento futuro dell’agente. 

Per simulare il sistema sopra descritto, i ricercatori si concentrano sulla creazione di una società interattiva di agenti ispirata al gioco di Sims. L’architettura descritta è collegata a ChatGPT e mostra con successo 25 interazioni tra agenti all’interno del loro sandbox. Di seguito è mostrato un esempio di attività degli agenti durante la giornata.

  

Il codice completo per creare Generative Agents e simulare il loro comportamento nel sandbox è stato reso open-source dai ricercatori, che puoi trovare nel seguente repository. Le indicazioni sono abbastanza semplici da poterle seguire senza troppi problemi.

Con i Generative Agents che stanno diventando un campo eccitante, molte ricerche si basano su questo argomento. In questo articolo, esploreremo vari articoli sui Generative Agents che dovresti leggere. Di cosa si tratta? Scopriamolo.

 

1. Communicative Agents per lo Sviluppo di Software

 

L’articolo Communicative Agents for Software Development (Quan et al., 2023) è un nuovo approccio rivoluzionario allo sviluppo del software utilizzando i Generative Agents. La premessa proposta dai ricercatori è come l’intero processo di sviluppo del software potrebbe essere semplificato ed unificato utilizzando la comunicazione naturale tramite i Large Language Models (LLM). Le attività includono lo sviluppo di codice, la generazione di documenti, l’analisi dei requisiti e molto altro.

I ricercatori indicano che generare un intero software utilizzando LLM presenta due sfide principali: l’allucinazione e la mancanza di contro-esame nel processo decisionale. Per affrontare questi problemi, i ricercatori propongono un framework di sviluppo del software basato su chat chiamato ChatDev.

Il framework di ChatDev segue quattro fasi: progettazione, codifica, test e documentazione. In ogni fase, ChatDev stabilisce diversi agenti con ruoli diversi, ad esempio revisori di codice, programmatori di software, ecc. Per garantire una comunicazione fluida tra gli agenti, i ricercatori hanno sviluppato una catena di chat che divide le fasi in sotto-task atomici sequenziali. Ogni sotto-task implementa collaborazione ed interazione tra gli agenti.

Il framework di ChatDev è mostrato nell’immagine seguente.

  

I ricercatori hanno effettuato vari esperimenti per misurare le prestazioni del framework di ChatDev nello sviluppo del software. Utilizzando gpt3.5-turbo-16k, di seguito troviamo le statistiche sull’esperimento di performance del software.

  

Il numero sopra riportato è una metrica sull’analisi statistica riguardante i sistemi software generati da ChatDev. Ad esempio, vengono generate almeno 39 righe di codice, con un massimo di 359 codici. I ricercatori hanno anche dimostrato che l’86,66% dei sistemi software generati funzionava correttamente.

È un ottimo documento che mostra il potenziale per cambiare il modo in cui lavorano gli sviluppatori. Leggi ulteriormente il documento per comprendere l’implementazione completa del ChatDev. Il codice completo è anche disponibile nel repository di ChatDev.

2. AgentVerse: Facilitare la collaborazione multi-agente ed esplorare comportamenti emergenti negli agenti

AgentVerse è un framework proposto nel documento di Chen et al., 2023 per simulare i gruppi di agenti mediante il Large Language Model per procedure dinamiche di risoluzione dei problemi all’interno del gruppo e l’adattamento dei membri del gruppo in base alla progressione. Questo studio si propone di risolvere la sfida delle dinamiche di gruppo statiche in cui l’agente autonomo non può adattarsi ed evolvere nella risoluzione dei problemi.

Il framework AgentVerse cerca di dividere il framework in quattro fasi, tra cui:

  1. Assunzione di esperti: Fase di aggiustamento per gli agenti per allinearli al problema e alla soluzione
  2. Decisione collaborativa: Gli agenti discutono per formulare una soluzione e una strategia per risolvere il problema.
  3. Esecuzione dell’azione: Gli agenti eseguono azioni nell’ambiente in base alla decisione.
  4. Valutazione: La condizione attuale e gli obiettivi vengono valutati. La ricompensa del feedback tornerà alla prima fase se l’obiettivo deve ancora essere raggiunto.

La struttura complessiva di AgentVerse è mostrata nell’immagine sottostante.

I ricercatori hanno sperimentato il framework e confrontato il framework AgentVerse con la soluzione dell’agente individuale. Il risultato è presentato nell’immagine sottostante.

Il framework AgentVerse può generalmente superare gli agenti individuali in tutte le attività presentate. Ciò dimostra che gli agenti generativi possono svolgere meglio degli agenti individuali nel tentativo di risolvere i problemi. Puoi provare il framework tramite il loro repository.

3. AgentSims: Una sandbox open source per la valutazione di Large Language Model

La valutazione delle capacità degli LLM è ancora una questione aperta nella comunità e nei settori. Tre punti che limitano la capacità di valutare correttamente gli LLM sono le capacità di valutazione limitata dai compiti, i benchmark vulnerabili e le metriche incondizionate. Per affrontare questi problemi, Lin et al., 2023 hanno proposto una valutazione basata sui compiti come benchmark degli LLM nel loro documento. Questo approccio sperava di diventare uno standard nella valutazione delle opere degli LLM in quanto potrebbe alleviare tutti i problemi sollevati. Per raggiungere questo obiettivo, i ricercatori hanno introdotto un framework chiamato AgentSims.

AgentSims è un programma con un’infrastruttura interattiva e di visualizzazione per la curatela dei compiti di valutazione per gli LLM. L’obiettivo complessivo di AgentSims è fornire ai ricercatori ed esperti una piattaforma per semplificare il processo di progettazione dei compiti e utilizzarli come strumento di valutazione. La parte frontale di AgentSims è presentata nell’immagine sottostante.

Visto che l’obiettivo di AgentSims è rivolto a tutti coloro che necessitano di una valutazione LLM in modo più semplice, i ricercatori hanno sviluppato la parte frontale dove possiamo interagire con l’interfaccia utente. Puoi anche provare la demo completa sul loro sito web o accedere al codice completo nel repository di AgentSims.

Conclusioni

Gli agenti generativi sono un approccio recente nelle LLM per simulare i comportamenti umani. Le ultime ricerche di Park et al., 2023 hanno mostrato una grande possibilità di ciò che gli agenti generativi potrebbero fare. Ecco perché sono emersi vari tipi di ricerche basate su agenti generativi, aprendo molte nuove porte.

In questo articolo abbiamo parlato di tre diverse ricerche sugli agenti generativi, tra cui:

  1. Articolo sugli Agenti Comunicativi per lo Sviluppo del Software (Quan et al., 2023)
  2. AgentVerse: Facilitare la Collaborazione Multi-Agente ed Esplorare Comportamenti Emergenti negli Agenti (Chen et al., 2023)

3. AgentSims: Una Sandbox Open-Source per la Valutazione di Modelli di Linguaggio Estesi (Lin et al., 2023)  Cornellius Yudha Wijaya è un assistente manager di data science e scrittore di dati. Mentre lavora a tempo pieno presso Allianz Indonesia, ama condividere consigli su Python e dati tramite i social media e la scrittura.