Elenco di modelli di Intelligenza Artificiale conversazionale rivoluzionari e open-source nel dominio del linguaggio

Elenco di modelli di IA conversazionale open-source rivoluzionari nel linguaggio.

Conversational AI si riferisce a tecnologie come un agente virtuale o un chatbot che utilizzano grandi quantità di dati e l’elaborazione del linguaggio naturale per imitare le interazioni umane e riconoscere il linguaggio parlato e scritto. Negli ultimi anni, il panorama di Conversational AI è evoluto drasticamente, soprattutto con il lancio di ChatGPT. Ecco alcuni altri modelli di linguaggio di grandi dimensioni (LLM) open-source che stanno rivoluzionando Conversational AI.

LLaMA

  • Data di rilascio: 24 febbraio 2023

LLaMa è un LLM fondamentale sviluppato da Meta AI. È progettato per essere più versatile e responsabile rispetto ad altri modelli. Il rilascio di LLaMa mira a democratizzare l’accesso alla comunità di ricerca e promuovere pratiche di AI responsabili.

LLaMa è disponibile in diverse dimensioni, con il numero di parametri che varia da 7 miliardi a 65 miliardi. L’accesso al modello sarà concesso caso per caso a laboratori di ricerca dell’industria, ricercatori accademici, ecc.

OpenAssistiant

  • Data di rilascio: 8 marzo 2023

Open Assistant è un progetto sviluppato da LAION-AI per fornire a tutti un grande modello di linguaggio di grandi dimensioni basato su chat. Attraverso un addestramento intensivo su grandi quantità di testo e codice, ha acquisito la capacità di svolgere varie attività, tra cui rispondere a domande, generare testo, tradurre lingue e produrre contenuti creativi.

Anche se OpenAssistant è ancora in fase di sviluppo, ha già acquisito diverse competenze, come l’interazione con sistemi esterni come Google Search per raccogliere informazioni. Inoltre, è un’iniziativa open-source, il che significa che chiunque può contribuire al suo progresso.

Dolly

  • Data di rilascio: 8 marzo 2023

Dolly è un LLM di istruzioni sviluppato da Databricks. È addestrato sulla piattaforma di machine-learning di Databricks con licenza per uso commerciale. Dolly è alimentato dal modello Pythia 12B ed è stato addestrato su una vasta gamma di registrazioni di istruzioni/risposte che ammontano a circa 15.000. Anche se non è all’avanguardia, le prestazioni di Dolly nel seguire le istruzioni sono di alta qualità.

Alpaca

  • Data di rilascio: 13 marzo 2023

Alpaca è un piccolo modello di istruzioni sviluppato dall’Università di Stanford. Si basa sul modello LLaMa di Meta (7 miliardi di parametri). È progettato per avere buone prestazioni su numerosi compiti di istruzioni, pur essendo facile e economico da riprodurre allo stesso tempo.

Anche se assomiglia al modello text-davinci-003 di OpenAI, è significativamente più economico (meno di $600) da produrre. Il modello è open-source ed è stato addestrato su un dataset di 52.000 dimostrazioni di seguire le istruzioni.

Vicuna

  • Data di rilascio: aprile 2023

Vicuna è stato sviluppato da un team di UC Berkeley, CMU, Stanford e UC San Diego. È un chatbot che è stato addestrato tramite il fine-tuning del modello LLaMa su conversazioni condivise dagli utenti e raccolte da ShareGPT.

Basato sull’architettura del transformer, Vicuna è un modello di linguaggio auto-regressivo e offre capacità di conversazione naturali e coinvolgenti. Con 13 miliardi di parametri, produce risposte più dettagliate e ben strutturate rispetto ad Alpaca, e la sua qualità è paragonabile a quella di ChatGPT.

Koala

  • Data di rilascio: 3 aprile 2023

Il Berkeley Artificial Intelligence Research Lab (BAIR) ha sviluppato Koala, che è un modello di dialogo basato sul modello LLaMa 13B. È destinato a essere più sicuro e facilmente interpretabile rispetto ad altri LLM. Koala è stato addestrato sulle interazioni disponibili gratuitamente, concentrandosi sui dati che includono l’interazione con modelli closed-source altamente capaci.

Koala è utile per lo studio della sicurezza e dei pregiudizi dei modelli di linguaggio e per comprendere il funzionamento interno dei modelli di linguaggio di dialogo. Inoltre, Koala è un’alternativa open-source a ChatGPT che include EasyLM, un framework per l’addestramento e il fine-tuning di LLM.

Pythia

  • Data di rilascio: aprile 2023

Eleuther AI ha creato un insieme di modelli di linguaggio autoregressivi chiamati Pythia, progettati per supportare la ricerca scientifica. Pythia è composto da 16 modelli diversi con un numero di parametri che varia da 70M a 12B. Tutti i modelli vengono addestrati utilizzando gli stessi dati e l’architettura, consentendo di confrontarli ed esplorare come si evolvono con la scalabilità.

OpenChatKit

  • Data di rilascio: 5 aprile 2023

Insieme ha sviluppato OpenChatKit, un framework di sviluppo di chatbot open source che mira a semplificare e ottimizzare il processo di creazione di applicazioni di intelligenza artificiale conversazionale. Il chatbot è progettato per la conversazione e l’istruzione e si distingue nella sintesi, nella generazione di tabelle, nella classificazione e nel dialogo.

Con OpenChatKit, gli sviluppatori possono accedere a una solida base open source per creare chatbot specializzati e ad uso generale per diverse applicazioni. Il framework si basa sull’architettura GPT-4 ed è disponibile in tre diverse dimensioni di modello, con 3B, 6B e 12B di parametri, per adattarsi a diverse risorse computazionali e requisiti delle applicazioni.

RedPajama

  • Data di rilascio: 13 aprile 2023

RedPajama è un progetto creato da un team composto da Together, Ontocord.ai, ETH DS3Lab, Stanford CRFM, Hazy Research e MILA Québec AI Institute. Il loro obiettivo è sviluppare modelli open source di prim’ordine, a partire dalla riproduzione dell’insieme di dati di addestramento LLaMA, che contiene più di 1,2 trilioni di token.

Questo progetto mira a creare un modello di linguaggio completamente aperto, replicabile e all’avanguardia con tre elementi essenziali: dati di pre-training, modelli di base e dati e modelli di addestramento tramite istruzioni. Attualmente, l’insieme di dati è accessibile tramite Hugging Face e gli utenti hanno la possibilità di replicare i risultati utilizzando script Apache 2.0, disponibili su GitHub.

StableLM

  • Data di rilascio: 19 aprile 2023

StableLM è un modello di linguaggio open source sviluppato da Stability AI. Il modello è addestrato su un insieme di dati sperimentali tre volte più grande del dataset The Pile ed è efficace in compiti conversazionali e di codifica nonostante le sue dimensioni ridotte. Il modello è disponibile con 3B e 7B di parametri, mentre sono in arrivo modelli più grandi.

StableLM può generare sia testo che codice, rendendolo adatto a diverse applicazioni. Stability AI mette anche a disposizione una serie di modelli di ricerca sintonizzati tramite istruzioni, utilizzando una combinazione di cinque insiemi di dati open source aggiornati appositamente progettati per agenti conversazionali. Questi modelli sintonizzati sono esclusivamente per la ricerca e sono disponibili con licenza CC BY-NC-SA 4.0 non commerciale.