Incontra MetaGPT il framework di intelligenza artificiale open-source che trasforma i GPT in ingegneri, architetti e manager.

Incontra MetaGPT, il framework open-source che trasforma i GPT in professionisti.

I modelli linguistici di grandi dimensioni (LLM) basati su sistemi multi-agente offrono opportunità eccezionali per imitare e migliorare le operazioni umane. Tuttavia, come dimostrato da recenti studi, i sistemi attuali a volte devono essere più accurati nella complessità presente nelle applicazioni del mondo reale. Questi sistemi hanno principalmente bisogno di aiuto per incoraggiare la collaborazione costruttiva attraverso scambi verbali e basati su strumenti, il che crea difficoltà nella generazione di scambi coerenti, nella riduzione dei loop di feedback controproducenti e nella facilitazione di interazioni collaborative fruttuose. Procedure operative standardizzate (SOP) ben strutturate sono necessarie affinché i processi complessi siano efficaci. È fondamentale avere una conoscenza approfondita e un’integrazione delle pratiche del mondo reale.

È importante affrontare questi vincoli comuni e incorporare queste conoscenze per migliorare il design e la struttura dei sistemi multi-agente basati su LLM e aumentarne l’efficacia e l’applicazione. Inoltre, attraverso una pratica collettiva estensiva, le persone hanno creato SOP generalmente riconosciute in vari campi. Queste SOP sono essenziali per facilitare la suddivisione efficace del lavoro e il coordinamento. Ad esempio, il processo a cascata nell’ingegneria del software stabilisce passi logici per l’analisi dei requisiti, la progettazione del sistema, la scrittura del codice, i test e le consegne.

Grazie a questo flusso di lavoro di consenso, diversi ingegneri possono lavorare insieme in modo produttivo. Inoltre, i lavori umani hanno conoscenze specializzate adatte alle loro mansioni: gli ingegneri del software utilizzano le loro competenze di programmazione per creare codice, mentre i responsabili di prodotto utilizzano la ricerca di mercato per identificare le esigenze dei clienti. La collaborazione si discosta dagli output tipici e diventa disorganizzata. Ad esempio, i responsabili di prodotto devono condurre approfondite ricerche di mercato che prendano in considerazione le esigenze degli utenti, le tendenze di mercato e i prodotti concorrenti per guidare lo sviluppo. Queste analisi devono essere seguite dalla creazione di documenti di requisiti del prodotto (PRD) che hanno un formato chiaro e standardizzato e obiettivi prioritari.

Questi artefatti normativi sono fondamentali per avanzare in progetti complicati e diversificati che richiedono contributi correlati da diverse figure professionali. Essi cristallizzano la comprensione comune. Pertanto, è fondamentale utilizzare documentazione, report e grafici organizzati che mostrino le dipendenze. In questo studio, i ricercatori di DeepWisdom, Xiamen University, The Chinese University of Hong Kong Shenzhen, Nanjing University, University of Pennsylvania e University of California, Berkeley presentano MetaGPT, un framework multi-agente innovativo che include conoscenze pratiche basate su SOP. In primo luogo, viene utilizzato un titolo di lavoro che descrive le loro mansioni per identificare ciascun agente. Ciò consente al sistema di inizializzarsi con il prompt prefix specifico del ruolo corretto. Invece di segnali goffi di gioco di ruolo, ciò incorpora la conoscenza di dominio nelle definizioni degli agenti. In secondo luogo, esaminano i processi umani efficaci per estrarre SOP con le conoscenze procedurali necessarie per i progetti di gruppo.

Queste SOP vengono codificate utilizzando specifiche di azione basate sul ruolo nell’architettura dell’agente. In terzo luogo, per facilitare lo scambio di informazioni, gli agenti creano output di azione standardizzati. MetaGPT semplifica il coordinamento tra lavori interdipendenti formalizzando gli artefatti che gli esperti umani scambiano. Gli agenti sono collegati da un ambiente condiviso che offre una visione delle attività e l’uso condiviso di strumenti e risorse. Tutte le comunicazioni tra gli agenti sono contenute in questo ambiente. Forniscono anche un pool di memoria globale in cui vengono memorizzati tutti i record di collaborazione, consentendo a qualsiasi agente di iscriversi o cercare i dati di cui hanno bisogno. Gli agenti possono recuperare messaggi precedenti da questo pool di memoria per ottenere maggiori contestualizzazione.

A differenza dell’assorbimento passivo di informazioni tramite il dialogo, questa architettura consente agli agenti di osservare e recuperare attivamente informazioni rilevanti. L’ambiente imita i sistemi presenti nei luoghi di lavoro reali che incoraggiano il lavoro di squadra. Mostrano flussi di lavoro collaborativi nello sviluppo del software e esperimenti correlati di implementazione del codice, compresi la produzione di piccoli giochi e sistemi più complessi, per illustrare l’efficacia della loro architettura. MetaGPT gestisce una complessità software molto maggiore rispetto a GPT-3.5 o altri framework open-source come AutoGPT e AgentVerse, misurata in linee di codice prodotto.

Inoltre, MetaGPT genera documenti di requisiti di alta qualità, artefatti di progettazione, diagrammi di flusso e specifiche dell’interfaccia durante il processo automatizzato end-to-end. Questi output intermedi standardizzati aumentano notevolmente il tasso di successo dell’esecuzione del codice finale. Grazie alla documentazione generata automaticamente, i programmatori umani possono imparare rapidamente e migliorare la loro competenza nel campo per migliorare ulteriormente i requisiti, le progettazioni e il codice. Consente anche un’interazione umano-AI più sofisticata. In conclusione, convalidano MetaGPT attraverso ricerche approfondite su vari progetti software.

Le possibilità rese possibili dal paradigma di cooperazione tra agenti esperti basato sul ruolo di MetaGPT sono dimostrate attraverso benchmark quantitativi di produzione di codice e valutazioni qualitative degli output dell’intero processo. In sintesi, hanno contribuito principalmente quanto segue:

• Hanno progettato un nuovo meccanismo di meta-programmazione, che include la definizione del ruolo, la decomposizione dei compiti, la standardizzazione dei processi e altri aspetti tecnici.

• Propongono MetaGPT, un framework collaborativo multi-agente basato su LLM che codifica le procedure operative standard (SOP) umane in agenti LLM ed estende fondamentalmente la capacità di risoluzione di problemi complessi.

• Effettuano test approfonditi nello sviluppo di codice CRUD2, lavori di analisi dei dati di base e giochi in Python con AutoGPT, AgentVerse, LangChain e MetaGPT.

In questo modo, MetaGPT può creare software complessi utilizzando la SOP. I risultati complessivi mostrano che MetaGPT supera significativamente i suoi concorrenti in termini di qualità del codice e conformità al processo previsto.