Le LLM di Google possono padroneggiare gli strumenti solo leggendo la documentazione

LLM di Google padroneggia strumenti solo leggendo documentazione.

Nell’era dei rapidi progressi tecnologici, l’Intelligenza Artificiale (IA) sta compiendo progressi straordinari che a volte sembrano quasi umani. I ricercatori di Google hanno presentato un risultato innovativo: i Large Language Models (LLM) possono ora sfruttare modelli di Machine Learning (ML) e API con il solo aiuto della documentazione degli strumenti. Questa rivelazione ha suscitato discussioni sulla convergenza tra IA e capacità umane.

Leggi anche: Differenze principali tra Intelligenza Artificiale e Intelligenza Umana

L’effetto Audrey: insegnare all’IA a guidare le biciclette

Immagina di insegnare a una bambina di quattro anni di nome Audrey a guidare una bicicletta. Inizi con le rotelle di sostegno, la guidi attraverso varie situazioni e infine Audrey guida con sicurezza. Allo stesso modo, i ricercatori di Google hanno introdotto LLM alle funzionalità degli strumenti attraverso la documentazione, consentendo loro di utilizzare questi strumenti senza alcuna formazione preliminare. È come se Audrey avesse imparato a guidare una bicicletta leggendo un libro: impressionante e indipendente.

Leggi anche: Meta pubblica come open source un modello AI addestrato simultaneamente su testo, immagini e audio

Dalle dimostrazioni alla documentazione: insegnare all’IA in una nuova prospettiva

Storicamente, i modelli di IA imparavano gli strumenti tramite dimostrazioni (demos), che richiedevano numerosi esempi. La svolta di Google cambia l’approccio. Hanno insegnato agli LLM utilizzando la documentazione degli strumenti (docs), descrivendo le funzionalità degli strumenti anziché dimostrare ogni caso d’uso. Questo nuovo metodo mira a scalare la comprensione degli strumenti da parte dell’IA e ad abilitarla a esplorarne le funzionalità in modo più efficace.

La laurea dell’IA: una moltitudine di compiti

Per valutare la potenza di questo nuovo approccio, i ricercatori di Google hanno coinvolto gli LLM in vari compiti, tra cui risposta a domande multimodali, ragionamento matematico su tabelle, ragionamento multimodale, uso non visto di API, editing di immagini e tracciamento video. Il modello, noto come ChatGPT, è stato messo alla prova e i risultati sono stati sorprendenti.

Leggi anche: L’IA ora può vedere e ascoltare: benvenuti nel mondo dell’IA multimodale

Rivelazione delle prestazioni: Strumenti + Docs vs Demos

Gli esperimenti di Google hanno rivelato l’impatto della documentazione sulle prestazioni degli LLM. Armato di documentazione degli strumenti, le prestazioni del modello sono rimaste stabili anche con una diminuzione del numero di dimostrazioni. Tuttavia, senza documentazione degli strumenti, le prestazioni del modello sono diventate vulnerabili alle variazioni del numero di dimostrazioni. Ciò dimostra il ruolo cruciale della documentazione nell’equipaggiare i modelli di IA con un utilizzo flessibile degli strumenti.

Leggi anche: Presentazione di GPTBot: la mossa coraggiosa di OpenAI per esplorare il web

L’eccezionale impresa dell’IA: il potere della documentazione degli strumenti

La documentazione degli strumenti è un vero e proprio game changer per la formazione e lo sviluppo dell’intelligenza artificiale. I ricercatori hanno dimostrato che gli LLM, alimentati esclusivamente dalla documentazione degli strumenti, possono utilizzare con destrezza modelli di visione recenti per compiti come l’editing di immagini e il tracciamento video. Questo risultato semplifica l’utilizzo degli strumenti e suggerisce il potenziale dell’IA per la scoperta autonoma della conoscenza. Tuttavia, le prestazioni diminuiscono quando la lunghezza del documento supera le 600 parole, evidenziando le limitazioni del modello.

Uno sguardo al futuro: implicazioni e scoperte

Oltre all’utilizzo degli strumenti, le scoperte di Google implicano un balzo verso la scoperta automatica della conoscenza tramite la documentazione degli strumenti. Questa ricerca colma il divario tra le capacità cognitive dell’IA e l’utilizzo degli strumenti. Riproducendo progetti popolari senza ulteriori dimostrazioni, il futuro dell’IA sembra illimitato, rivelando potenzialmente nuove dimensioni nelle sue capacità di ragionamento.

La nostra opinione

La ricerca di Google mostra l’evoluzione straordinaria dell’IA, spingendo i confini di ciò che sembrava possibile. Mentre l’intelligenza artificiale domina modelli di ML e API attraverso la documentazione degli strumenti, non solo apre la strada a un aumento dell’efficienza, ma svela anche il potenziale di auto-scoperta all’interno dei sistemi di intelligenza artificiale. L’intersezione tra IA e documentazione degli strumenti segna un passo significativo verso un mondo in cui le capacità simili a quelle umane si incontrano con la competenza tecnologica.