Può questo modello cinese di IA superare ChatGPT e Claude2? Conosci il modello Baichuan2-192k presentato da questa startup cinese ‘Baichuan Intelligent’ con il modello di contesto più lungo
Può il modello cinese di intelligenza artificiale Baichuan2-192k superare ChatGPT e Claude2 con il suo contesto più lungo? Scopri la nuova innovazione di Baichuan Intelligent
Nella corsa alla supremazia dell’IA, una start-up cinese di intelligenza artificiale, Baichuan Intelligent, ha presentato il suo ultimo modello di linguaggio di grandi dimensioni, il Baichuan2-192K, stabilendo nuovi parametri nel trattamento di prompt di testo lunghi. Questo sviluppo evidenzia la determinazione della Cina nel affermarsi come leader nel panorama globale dell’IA.
La domanda di modelli di IA capaci di gestire prompt di testo estesi, come romanzi, documenti legali e relazioni finanziarie, è in aumento. I modelli tradizionali spesso faticano con il testo esteso e c’è bisogno di soluzioni più potenti ed efficienti in vari settori.
Attualmente, il panorama dell’IA è dominato dai giganti occidentali come OpenAI e Meta, che sono stati continuamente innovativi e hanno rilasciato modelli sofisticati. Il nuovo rilascio di Baichuan Intelligent, il Baichuan2-192K, sfida questi giocatori consolidati.
- Samsung presenta ‘Gauss’ un nuovo modello di intelligenza artificiale nel linguaggio per sfidare il dominio di ChatGPT.
- Questa ricerca di intelligenza artificiale introduce Atom una tecnica di quantizzazione a basso bit per un servizio efficiente e accurato di modelli di lingua (LLM) di grandi dimensioni.
- Questa ricerca sull’IA introduce metodi innovativi per adattare i modelli di linguaggio alla progettazione dei chip
Baichuan Intelligent, fondata dal fondatore di Sogou, Wang Xiaochuan, ha introdotto il Baichuan2-192K, un innovativo modello di linguaggio di grandi dimensioni. Questo modello vanta una notevole “finestra di contesto”, che gli consente di elaborare circa 350.000 caratteri cinesi in una sola volta. In confronto, supera di 14 volte l’OAI GPT-4-32k e di 4,4 volte il Claude 2 di Anthropic supportato da Amazon, rendendolo uno strumento potente per gestire prompt di testo di lunga durata.
La principale innovazione di Baichuan2-192K risiede nella sua capacità di elaborare testo esteso senza soluzione di continuità. Eccelle nell’elaborazione e nel riassunto dei romanzi, offrendo risposte di qualità e comprendendo il testo lungo, come dimostrato dai risultati dei test di LongEval, un progetto avviato dall’Università della California, Berkeley, e altre istituzioni statunitensi. La straordinaria lunghezza del contesto del modello è ottenuta attraverso innovazioni tecniche nell’encoding posizionale dinamico e nelle strutture di formazione distribuite, senza sacrificare le prestazioni. L’eccezionale capacità di Baichuan2-192K lo posiziona come uno strumento essenziale per le imprese nei settori legali, dei media e finanziari. La sua capacità di elaborare e generare testo di lunga durata è fondamentale in questi settori. Tuttavia, è importante sottolineare che la capacità di elaborare più informazioni non rende necessariamente un modello di IA migliore rispetto ai suoi concorrenti, come evidenziato da una ricerca congiunta dell’Università di Stanford e UC Berkeley.
La rapida ascesa di Baichuan Intelligent nel settore dell’IA, compresa l’ingresso di recente nel club degli unicorni a soli sei mesi dalla sua fondazione, dimostra l’impegno della Cina nel spingere i limiti della tecnologia dell’IA. Mentre attualmente le aziende americane detengono la leadership nell’hardware e nel software dell’IA, la strategia aggressiva e le innovazioni tecnologiche di Baichuan mostrano l’evolversi del panorama dell’IA. La presentazione di Baichuan2-192K è una prova che la corsa alla supremazia dell’IA è lontana dall’essere conclusa, con la Cina determinata a sfidare la dominanza dei giganti occidentali nel settore. Baichuan2-192K è un modello innovativo che spinge i limiti della tecnologia dell’IA, in particolare nella gestione di prompt di testo lunghi. La sua eccezionale lunghezza del contesto e le risposte di qualità lo rendono uno strumento prezioso per vari settori.