Alibaba AI rende Open Source la serie Qwen, che include Qwen-1.8B, Qwen-7B, Qwen-14B e Qwen-72B insieme alla serie Qwen-Chat.

Alibaba AI annuncia l'apertura del codice sorgente per la serie Qwen, che comprende Qwen-1.8B, Qwen-7B, Qwen-14B e Qwen-72B insieme alla serie Qwen-Chat.

Con i modelli più recenti della sua serie Qwen di modelli di intelligenza artificiale open-source, Alibaba Cloud sta spingendo ancora più in là i confini della tecnologia AI. Alibaba ha ampliato le sue soluzioni AI con il rilascio di Qwen-1.8B e Qwen-72B, oltre a modelli specializzati per chat e audio. La dedizione di Alibaba allo sviluppo delle capacità di intelligenza artificiale è dimostrata da questi modelli, che offrono prestazioni e versatilità migliorate nel linguaggio e nell’elaborazione audio.

Con il rilascio del Qwen-1.8B e della sua versione più grande, il Qwen-72B, la serie Qwen – che comprende già il Qwen-7B e il Qwen-14B – è stata significativamente potenziata. Preallenato su un enorme corpus di oltre 2,2 trilioni di token, Qwen-1.8B è un modello basato su transformer con 1,8 miliardi di parametri. Questo modello supera molti modelli di dimensioni simili e persino più grandi in varie attività linguistiche sia in cinese che in inglese. Supporta inoltre un contesto lungo con 8192 token.

In particolare, il Qwen-1.8B, con le sue varianti quantizzate int4 e int8, offre una soluzione di implementazione conveniente. Queste caratteristiche lo rendono una scelta sensata per varie applicazioni, riducendo drasticamente le esigenze di memoria. La sua vasta vocabolario di oltre 150K token migliora ulteriormente la sua capacità linguistica.

Il modello di dimensioni più grandi, Qwen-72B, è stato allenato su 3 trilioni di token. Questo modello supera GPT-3.5 nella maggior parte delle attività e supera LLaMA2-70B in tutte le attività testate. Alibaba ha progettato i modelli per consentire la distribuzione a basso costo nonostante i loro numerosi parametri; le versioni quantizzate consentono un utilizzo minimo della memoria di circa 3GB. Questa innovazione riduce significativamente gli ostacoli al lavoro con modelli massicci che un tempo costavano milioni di dollari sui sistemi di cloud computing.

Alibaba ha introdotto Qwen-Chat, versioni ottimizzate progettate per il supporto AI e le capacità di conversazione, oltre ai modelli di base di Qwen. Oltre a generare materiale e facilitare la conversazione naturale, Qwen-Chat può eseguire interpretazione del codice e compiti di sintesi.

Con la sua capacità di gestire vari input audio oltre al testo per generare output di testo, il Qwen-Audio di Alibaba rappresenta un notevole avanzamento nella AI multimodale. In modo sorprendente, Qwen-Audio raggiunge prestazioni all’avanguardia nel riconoscimento vocale e in una varietà di standard di comprensione audio senza la necessità di un addestramento accurato.

Nell’ambito dell’audio, Qwen-Audio stabilisce un nuovo punto di riferimento come modello audio-linguaggio di base. Utilizza un framework di apprendimento multitask per gestire molti formati audio. Ottiene risultati impressionanti su più benchmark, tra cui punteggi all’avanguardia su attività come AISHELL-1 e VocalSound.

La flessibilità del Wen-Audio include la possibilità di gestire diverse sessioni di chat da input di testo e audio, con funzionalità che vanno dalla modifica del discorso all’apprezzamento della musica e all’interpretazione del suono.