L’azienda indiana Startup rilascia OpenHathi il primo LLM in hindi di sempre

L'azienda indiana Startup lancia OpenHathi, il primo LLM in hindi di tutti i tempi

In un notevole passo verso l’innovazione linguistica, la startup indiana di AI Sarvam AI ha pubblicato OpenHathi LLM, segnando un significativo salto nel campo dei modelli linguistici in lingua hindi. Appena una settimana dopo aver ottenuto un impressionante finanziamento di 41 milioni di dollari nella Serie A, l’azienda ha introdotto OpenHathi-Hi-v0.1, la prima release della serie OpenHathi.

Genesi di OpenHathi

La creazione più recente di Sarvam AI si basa sull’architettura Llama2-7B di Meta AI, appositamente sviluppata per le sfumature della lingua hindi, la lingua più parlata in India. Posizionato come il primo Hindi Large Language Model (LLM) della serie OpenHathi, promette prestazioni all’altezza del GPT-3.5 per le lingue indiane. Le fondamenta del modello si basano su una piattaforma conveniente, estendendo le capacità del Llama2-7B.

Rivelazione del processo di addestramento

OpenHathi-Hi-v0.1 segue un meticoloso processo di addestramento in due fasi. Inizialmente, l’attenzione è rivolta all’allineamento dell’incorporazione, allineando le incorporazioni casualmente inizializzate in hindi. Successivamente, il modello si impegna nella modellazione del linguaggio bilingue, padroneggiando l’attenzione cross-linguistica tra i token. Il risultato è una robusta performance in diversi compiti in hindi, mostrando competenza sia nello script nativo che in quello romanizzato.

Collaborazioni e contributi accademici

Sviluppato in collaborazione con partner accademici presso AI4Bharat, OpenHathi-Hi-v0.1 di Sarvam AI beneficia delle risorse linguistiche e dei benchmark forniti da questi partner. Questo sforzo collaborativo supera i confini linguistici, come dimostrato dall’annuncio recente di KissanAI di Dhenu 1.0, un innovativo Agriculture Large Language Model. Questa meraviglia bilingue si rivolge direttamente alle esigenze linguistiche degli agricoltori in inglese, hindi e hinglish.

Strada futura per Sarvam AI

Pratyush Kumar e Vivek Raghavan, i co-fondatori di Sarvam AI, hanno dato impulso allo startup nel luglio 2023. Sostenuti da un consistente finanziamento nella Serie A guidato da Lightspeed Ventures, i due immaginano di affrontare le esigenze uniche dell’India attraverso l’integrazione di Generative AI per diverse lingue indiane. Il loro focus si estende alla promozione di collaborazioni con aziende per lo sviluppo di modelli AI specifici per settori utilizzando i dati come base.

La nostra opinione

In un panorama in cui la diversità linguistica è fondamentale, OpenHathi-Hi-v0.1 di Sarvam AI emerge come una promettente aggiunta, incarnando un impegno per l’innovazione nell’AI indiana. Lo spirito di collaborazione con i partner accademici e una chiara roadmap per il futuro posizionano Sarvam AI come un pioniere nel dominio dell’AI generativa. Mentre il modello invita gli sviluppatori ad esplorarne il potenziale, ci aspettiamo un effetto a cascata di creatività e modelli specializzati che arricchiranno ulteriormente il panorama dell’AI in India.

Attaccandosi ai principi di trasparenza e collaborazione, il percorso di Sarvam AI dalla ricerca allo sviluppo di infrastrutture digitali ai modelli linguistici pionieristici dimostra un approccio consapevole nel rispondere all’unico panorama linguistico dell’India.