La startup scrive una storia di successo sull’IA generativa con NVIDIA NeMo

Startup writes success story on generative AI with NVIDIA NeMo

L’apprendimento automatico ha aiutato Waseem Alshikh a sfogliare i libri di testo all’università. Ora sta mettendo l’IA generativa al lavoro, creando contenuti per centinaia di aziende.

Nato e cresciuto in Siria, Alshikh non parlava inglese, ma era fluente nel linguaggio dei software, un talento che gli è servito bene quando è arrivato all’università in Libano.

“Il primo giorno mi hanno dato una pila di libri di testo, ognuno di mille pagine, e tutto in inglese”, ha ricordato.

Cosi, ha scritto un programma – un classificatore statistico rudimentale ma efficace che riassumeva i libri – poi ha studiato i riassunti.

Dal concetto all’azienda

Nel 2014, ha condiviso la sua storia con May Habib, un’imprenditrice che ha incontrato mentre lavorava a Dubai. Hanno deciso di creare una startup che potesse aiutare i reparti marketing – che sono sempre sotto pressione per fare di più con meno – a utilizzare l’apprendimento automatico per creare rapidamente testi per le loro pagine web, blog, annunci e altro ancora.

“Inizialmente, la tecnologia non c’era, fino a quando sono state annunciate le modelli di trasformatori – era qualcosa su cui potevamo costruire”, ha detto Alshikh, CTO della startup.

Co-fondatori della startup, Habib, CEO, e Alshikh, CTO.

“Abbiamo trovato alcuni ingegneri e abbiamo impiegato quasi sei mesi per costruire il nostro primo modello, una rete neurale che funzionava a malapena e aveva circa 128 milioni di parametri”, una misura spesso utilizzata per valutare le capacità di un modello di intelligenza artificiale.

Nel corso del tempo, la giovane azienda ha ottenuto qualche contratto, ha cambiato il suo nome in Writer e si è collegata con NVIDIA.

Una startup accelerata

“Una volta che ci hanno presentato a NVIDIA NeMo, siamo stati in grado di costruire modelli industriali con tre, poi con 20 e ora con 40 miliardi di parametri, e stiamo ancora scalando”, ha detto.

NeMo è un framework di applicazione che aiuta le aziende a gestire i loro dataset di addestramento, a costruire e personalizzare grandi modelli di linguaggio (LLM) e ad eseguirli in produzione su larga scala. Organizzazioni da tutto il mondo, dalla Corea alla Svezia, lo utilizzano per personalizzare LLM per le loro lingue locali e i loro settori industriali.

“Prima di NeMo, ci ci volevano quattro mesi e mezzo per costruire un nuovo modello di un miliardo di parametri. Ora possiamo farlo in 16 giorni – è incredibile”, ha detto Alshikh.

I modelli creano opportunità

Nei primi sei mesi di quest’anno, il team della startup, composto da meno di 20 ingegneri di intelligenza artificiale, ha utilizzato NeMo per sviluppare 10 modelli, ciascuno con 30 miliardi di parametri o più.

Ciò si traduce in grandi opportunità. Centinaia di aziende utilizzano ora i modelli di Writer personalizzati da NeMo per finanza, sanità, vendite al dettaglio e altri settori verticali.

Lo strumento di riepilogo di Writer crea riassunti scritti da registrazioni audio di un’intervista o di un evento.

L’elenco dei clienti della startup include nomi noti come Deloitte, L’Oreal, Intuit, Uber e molte altre aziende Fortune 500.

Il successo di Writer con NeMo è solo l’inizio della storia. Decine di altre aziende hanno già scaricato NeMo.

Il software sarà presto disponibile per chiunque lo voglia utilizzare. Fa parte di NVIDIA AI Enterprise, un software completo ottimizzato per accelerare i carichi di lavoro di intelligenza artificiale generativa e supportato da supporto di livello enterprise, sicurezza e stabilità dell’interfaccia di programmazione delle applicazioni.

Writer offre una piattaforma completa per gli utenti enterprise.

Un trilione di chiamate API al mese

Alcuni clienti eseguono i modelli di Writer sui propri sistemi o servizi cloud. Altri chiedono a Writer di ospitare i modelli o utilizzano l’API di Writer.

“La nostra infrastruttura cloud, gestita fondamentalmente da due persone, gestisce un trilione di chiamate API al mese – stiamo generando 90.000 parole al secondo”, ha detto Alshikh. “Stiamo fornendo modelli di alta qualità che competono con i prodotti di aziende con team più grandi e budget più elevati.”

NVIDIA NeMo supporta un flusso end-to-end per l’IA generativa, dalla cura dei dati all’inferenza.

Writer utilizza il Triton Inference Server incluso in NeMo per eseguire i modelli in produzione per i propri clienti. Alshikh afferma che Triton, utilizzato da molte aziende che eseguono LLM, consente una latenza inferiore e una maggiore capacità rispetto ad altri programmi alternativi.

“Ciò significa che è possibile gestire un servizio con $20.000, anziché $100.000, quindi possiamo investire di più nella creazione di funzionalità significative”, ha detto.

Un Vasto Orizzonte

Writer è anche membro di NVIDIA Inception, un programma che sostiene le startup all’avanguardia. “Grazie a Inception, abbiamo avuto un accesso anticipato a NeMo e alcune persone straordinarie che ci hanno guidato nel processo di ricerca e utilizzo degli strumenti di cui abbiamo bisogno”, ha detto.

Ora che i prodotti testuali di Writer stanno ottenendo successo, Alshikh, che divide il suo tempo tra case in Florida e California, sta cercando l’orizzonte per scoprire cosa viene dopo. Nell’ampio panorama dell’IA generativa, vede opportunità nelle immagini, nell’audio, nei video, nei contenuti in 3D, forse in tutto questo insieme.

“Vediamo la multimodalità come il futuro”, ha detto.

Consulta questa pagina per iniziare con NeMo. E scopri qui il programma di accesso anticipato per NeMo multimodale.

E se hai apprezzato questa storia, fai sapere alle persone sui social network utilizzando quanto segue, un riassunto suggerito da Writer:

“Scopri come la startup Writer utilizza il software NVIDIA NeMo per generare contenuti per centinaia di aziende e ottenere significativi ricavi con un piccolo staff e un budget ridotto”.