NVIDIA accelera lo sviluppo personalizzato dei modelli IA generativi per le aziende

NVIDIA accelera lo sviluppo personalizzato dei modelli generativi di intelligenza artificiale per le aziende

Oggi il panorama delle grandi modelli di linguaggio (LLM) gratuiti e open source è come un buffet a volontà per le imprese. Questa abbondanza può essere travolgente per gli sviluppatori che costruiscono applicazioni AI generative personalizzate, in quanto devono navigare tra i requisiti unici del progetto e del business, tra cui compatibilità, sicurezza e i dati utilizzati per addestrare i modelli.

I modelli per fondazioni AI di NVIDIA – una collezione selezionata di modelli preaddestrati di alta qualità per le imprese – offrono agli sviluppatori un punto di partenza per portare l’AI generativa personalizzata nelle loro applicazioni aziendali.

I modelli per fondazioni ottimizzate da NVIDIA velocizzano l’innovazione

I modelli per fondazioni AI di NVIDIA possono essere esperiti tramite un’interfaccia utente semplice o API, direttamente da un browser. Inoltre, questi modelli possono essere acceduti tramite i punti di accesso delle fondazioni AI di NVIDIA per testare le prestazioni del modello all’interno delle loro applicazioni aziendali.

I modelli disponibili includono modelli comunitari leader come Llama 2, Stable Diffusion XL e Mistral, che sono formattati per aiutare gli sviluppatori a semplificare la personalizzazione con dati proprietari. Inoltre, i modelli sono stati ottimizzati con NVIDIA TensorRT-LLM per offrire la massima velocità di trasferimento e la latenza più bassa e per funzionare su qualsiasi stack NVIDIA GPU-accelerated a scala. Ad esempio, il modello Llama 2 ottimizzato con TensorRT-LLM funziona quasi il doppio più veloce su NVIDIA H100.

La nuova famiglia di modelli di fondazione Nemotron-3 8B di NVIDIA supporta la creazione delle applicazioni di chat e Q&A aziendali più avanzate per una vasta gamma di settori, tra cui sanità, telecomunicazioni e servizi finanziari.

Questi modelli sono un punto di partenza per i clienti che creano applicazioni AI generative sicure e pronte per la produzione, sono addestrati su set di dati responsabilmente ottenuti e operano con prestazioni comparabili a modelli molto più grandi. Questo li rende ideali per le implementazioni aziendali.

La capacità multilingue è un elemento distintivo dei modelli Nemotron-3 8B. I modelli sono già proficienti in oltre 50 lingue, tra cui inglese, tedesco, russo, spagnolo, francese, giapponese, cinese, coreano, italiano e olandese.

Personalizzazione rapida fino alla distribuzione

Le imprese che utilizzano l’IA generativa in tutte le funzioni aziendali hanno bisogno di una fonderia di IA per personalizzare i modelli per le loro applicazioni uniche. La fonderia di IA di NVIDIA presenta tre elementi – i modelli per fondazioni AI di NVIDIA, il framework e gli strumenti di NVIDIA NeMo, e i servizi di supercalcolo AI di NVIDIA DGX Cloud. Insieme, offrono una soluzione aziendale end-to-end per la creazione di modelli di AI generativa personalizzati.

È importante sottolineare che le imprese possiedono i propri modelli personalizzati e possono distribuirli praticamente ovunque su calcoli accelerati con sicurezza, stabilità e supporto di livello aziendale utilizzando il software NVIDIA AI Enterprise.

I modelli per fondazioni AI di NVIDIA sono liberamente disponibili per sperimentare ora sul catalogo NVIDIA NGC e Hugging Face, e sono anche ospitati nel catalogo dei modelli AI di Microsoft Azure.

Cloud,Cloud Services,Data Center,Generative AI,software,TensorRT

Nuove istanze di GPU tensoriali NVIDIA H100, H200 in arrivo su Microsoft Azure per accelerare i carichi di lavoro dell’intelligenza artificiale

Accendendo il futuro il rilascio di TensorRT-LLM accelera le prestazioni di inferenza dell’IA, aggiunge supporto per i nuovi modelli in esecuzione su PC Windows 11 alimentati da RTX

NVIDIA accelera lo sviluppo personalizzato dei modelli IA generativi per le aziende

NVIDIA accelera lo sviluppo personalizzato dei modelli generativi di intelligenza artificiale per le aziende

I modelli per fondazioni ottimizzate da NVIDIA velocizzano l’innovazione

Personalizzazione rapida fino alla distribuzione

Nuove istanze di GPU tensoriali NVIDIA H100, H200 in arrivo su Microsoft Azure per accelerare i carichi di lavoro dell’intelligenza artificiale

Accendendo il futuro il rilascio di TensorRT-LLM accelera le prestazioni di inferenza dell’IA, aggiunge supporto per i nuovi modelli in esecuzione su PC Windows 11 alimentati da RTX

È l’Argentina la prima elezione A.I.?

La razza non può essere utilizzata per prev...

Le università formano ingegneri per il futu...

Revolutionizzare il settore del commercio a...

Proxy SOCKS5 vs. Proxy HTTP Quale è il migl...

Risposte di emergenza intelligenti alle con...

AI