ToolFormer Guidare i modelli AI nell’uso di strumenti esterni

Guida ToolFormer all'uso di strumenti esterni con modelli AI

Il Meta’s LLM impara a chiamare API esterne

Immagine creata dall'autore usando Midjourney

Ora che la polvere è caduta, sono noti i punti deboli dei LLM.

Anche il potente GPT-4 ha difficoltà con le operazioni matematiche.

Inoltre, il tempo di addestramento è un limite intrinseco di ogni LLM. Faticano a rispondere a domande su argomenti nuovi.

Una soluzione approssimativa è utilizzare Plugins esterni (ad esempio, Plugin ChatGPT). Tuttavia, l’utente deve specificare manualmente alcune azioni e questi plugin sono a volte poco affidabili.

E se ci fosse un modello che conosce le proprie debolezze – ed è addestrato a chiamare lo strumento esterno ottimale in caso di incertezza?

Ecco quello che ha fatto Meta, creando ToolFormer[1]. In questo articolo, discutiamo di:

  • Cosa è ToolFormer e perché è una svolta?
  • Come funziona il modello.
  • Come la metodologia di ToolFormer può essere applicata a qualsiasi LLM.
  • Perché la ricerca di intelligenza artificiale si dirige verso la visione di ToolFormer.

Facciamolo.

Punti deboli dei Large Language Models

Prima di iniziare a descrivere ToolFormer, esploriamo quali problemi affrontano i moderni LLM:

  • Progressione del tempo: Ogni LLM ha una data di chiusura dell’addestramento. Pertanto, non possono accedere a informazioni aggiornate e eventi recenti.
  • Fatti errati: I LLM sono famosi per inventare fatti, luoghi, eventi, prodotti e persino ricerche.
  • Operazioni matematiche: I LLM hanno difficoltà con i calcoli matematici.
  • Lingue rare: I LLM non possono gestire lingue a bassa risorsa, di solito a causa della mancanza di dati di addestramento.

Ovviamente, questi problemi sono irrilevanti per la meccanica del linguaggio. Una soluzione ideale sarebbe combinare la generazione di testo con strumenti esterni.

Ecco ToolFormer.

Cosa è ToolFormer?

ToolFormer è un LLM addestrato per decidere quali API chiamare, quando chiamarle e quali argomenti passare per chiamarle.