Parlami Quante parole legge un modello

Quante parole legge un modello

| INTELLIGENZA ARTIFICIALE | LLM | NLP |

Perché e come superare il limite interno di un Grande Modello di Linguaggio

Foto di C D-X su Unsplash

I LLM hanno dimostrato le loro capacità negli ultimi mesi, dimostrando di essere competenti in una vasta gamma di compiti. Tutto questo attraverso una modalità di interazione: l’input.

Negli ultimi mesi c’è stata una corsa per ampliare il contesto dei modelli di linguaggio. Ma come influisce tutto ciò su un modello di linguaggio?

Questo articolo è diviso in diverse sezioni, per ognuna delle quali risponderemo a queste domande:

  • Cos’è un input e come costruire un buon input?
  • Cos’è la finestra di contesto? Quanto può essere lunga? Cosa limita la lunghezza della sequenza di input di un modello? Perché è importante?
  • Come possiamo superare queste limitazioni?
  • I modelli utilizzano la lunga finestra di contesto?

Come interagire con un modello?

Foto di Jamie Templeton su Unsplash

Cos’è un input e cos’è un buon input?

In parole semplici, un input è il modo in cui si interagisce con un grande modello di linguaggio (LLM). Dato un LLM, possiamo interagire fornendo istruzioni sotto forma di testo. Questo input testuale contiene le informazioni di cui il modello ha bisogno per elaborare una risposta. L’input può contenere una domanda, una descrizione del compito, un contenuto e molte altre informazioni. Fondamentalmente, attraverso l’input forniamo al modello quale sia la nostra intenzione e cosa ci aspettiamo che risponda.

L’input può cambiare drasticamente il comportamento del modello. Ad esempio, chiedere al modello “descrivi la storia della Francia” è diverso dal chiedergli “descrivi la storia della Francia in tre frasi” o “descrivi la storia della Francia in forma di rap”.

Per ottenere informazioni adeguate dal modello, è consigliabile scrivere un buon input. In generale, un buon input dovrebbe contenere una domanda o un insieme di istruzioni. Inoltre, potrebbe esserci un contesto (domanda + contesto). Ad esempio, potremmo chiedere al modello di…