Crea LLM (Lingua Modello Linguistico) più capacitati con Generazione potenziata da recupero

Generazione potenziata da recupero per LLM più capacitati

Come il Recupero Aumentato della Generazione può Migliorare i tuoi LLMs Integrando una Base di Conoscenza

Immagine dell'autore: Generata con Midjourney

Le Limitazioni di ChatGPT

ChatGPT è limitato per molti casi d’uso pratici aziendali al di fuori della generazione di codice. La limitazione deriva dai dati di addestramento e dalla tendenza del modello a creare falsi. Al momento della scrittura, se provi a fare domande a Chat-GPT sugli eventi che si verificano dopo settembre 2021, probabilmente riceverai una risposta del genere:

Immagine dell'autore

Questo non è utile, quindi come possiamo rimediare?

Opzione 1 — Addestra o affina il modello con dati aggiornati.

L’affinamento o l’addestramento di un modello può essere impratico ed costoso. Mettendo da parte i costi, lo sforzo richiesto per preparare i set di dati è sufficiente per rinunciare a questa opzione.

Opzione 2 — Usa metodi di recupero aumentato della generazione (RAG).

I metodi RAG ci permettono di dare al grande modello di linguaggio accesso a una base di conoscenza aggiornata. Questo è molto più economico rispetto all’addestramento di un modello da zero o all’affinamento, e molto più facile da implementare. In questo articolo, ti mostro come sfruttare RAG con il tuo modello OpenAI. Metteremo alla prova il modello conducendo una breve analisi sulla sua capacità di rispondere a domande sul conflitto Russia-Ucraina del 2022 da una base di conoscenza di Wikipedia.

Nota: Questo argomento, sebbene delicato, è stato scelto per il motivo ovvio che il modello ChatGPT attuale non ne ha conoscenza.

Librerie e Pre-requisiti

Avrai bisogno di una chiave API di OpenAI, puoi ottenerla direttamente dal loro sito web o seguire questo tutorial. Il framework utilizzato per RAG è Haystack di Deepset, che è open source. Forniscono API che ti consentono di creare applicazioni su grandi modelli di linguaggio. Utilizziamo anche sentence transformers e la libreria transformers di Hugging Face.

Le Incorporazioni di Frase Aiutano i Modelli a Interpretare il Testo