GPU NVIDIA H100 ora disponibili su AWS Cloud

GPU NVIDIA H100 disponibili su AWS Cloud

Gli utenti di AWS possono ora accedere alle prestazioni leader dimostrate nei benchmark dell’industria per l’addestramento e l’inferenza dell’IA.

Il gigante del cloud ha ufficialmente attivato una nuova istanza Amazon EC2 P5 alimentata da GPU NVIDIA H100 Tensor Core. Il servizio consente agli utenti di scalare l’IA generativa, l’elaborazione ad alte prestazioni (HPC) e altre applicazioni con un clic dal browser.

La notizia arriva dopo il momento dell’iPhone dell’IA. Sviluppatori e ricercatori stanno utilizzando modelli di linguaggio di grandi dimensioni (LLM) per scoprire nuove applicazioni per l’IA quasi quotidianamente. Portare questi nuovi casi d’uso sul mercato richiede l’efficienza dell’elaborazione accelerata.

La GPU NVIDIA H100 offre prestazioni di classe supercomputing attraverso innovazioni architettoniche che includono Tensor Core di quarta generazione, un nuovo motore Transformer per accelerare gli LLM e la tecnologia NVLink più recente che consente alle GPU di comunicare tra loro a 900 GB/sec.

Scalare con istanze P5

Le istanze Amazon EC2 P5 sono ideali per l’addestramento e l’esecuzione di inferenze per LLM e modelli di visione artificiale sempre più complessi. Queste reti neurali guidano le applicazioni di IA generativa più esigenti e intensive in termini di elaborazione, tra cui risposta a domande, generazione di codice, generazione di video e immagini, riconoscimento vocale e altro ancora.

Le istanze P5 possono essere distribuite in cluster di iperscala chiamati EC2 UltraCluster, composti da elaborazione ad alte prestazioni, rete e archiviazione nel cloud. Ogni EC2 UltraCluster è un supercomputer potente, che consente ai clienti di eseguire i carichi di lavoro di addestramento AI più complessi e distribuiti di HPC su più sistemi.

Per consentire ai clienti di eseguire applicazioni su larga scala che richiedono elevati livelli di comunicazione tra nodi di calcolo, l’istanza P5 dispone di reti non bloccanti su scala petabit, alimentate da AWS EFA, un’interfaccia di rete da 3.200 Gbps per le istanze Amazon EC2.

Con le istanze P5, le applicazioni di apprendimento automatico possono utilizzare la libreria di comunicazione collettiva NVIDIA per utilizzare fino a 20.000 GPU H100.

NVIDIA AI Enterprise aiuta gli utenti a sfruttare al meglio le istanze P5. È una suite completa di software che include oltre 100 framework, modelli preaddestrati, flussi di lavoro di IA e strumenti per ottimizzare l’infrastruttura di IA.

Progettato per semplificare lo sviluppo e il deployment di applicazioni di IA, NVIDIA AI Enterprise affronta le complessità della costruzione e della gestione di una piattaforma software di IA sicura, nativa del cloud e ad alte prestazioni. Disponibile sul Marketplace di AWS, offre monitoraggio continuo della sicurezza, patch regolari e tempestive di vulnerabilità e esposizioni comuni, stabilità delle API e supporto aziendale, nonché accesso agli esperti di IA di NVIDIA.

Cosa dicono i clienti

NVIDIA e AWS collaborano da oltre una dozzina di anni per portare l’accelerazione GPU nel cloud. Le nuove istanze P5, l’ultimo esempio di questa collaborazione, rappresentano un passo avanti importante per fornire le prestazioni all’avanguardia che consentono agli sviluppatori di inventare la prossima generazione di IA.

Ecco alcuni esempi di ciò che dicono già i clienti:

Anthropic costruisce sistemi di intelligenza artificiale affidabili, interpretabili e controllabili che avranno molte opportunità per creare valore commercialmente e a beneficio pubblico.

“Mentre i grandi sistemi di IA generali di oggi possono avere significativi vantaggi, possono anche essere imprevedibili, inaffidabili e opachi, quindi il nostro obiettivo è fare progressi su questi problemi e distribuire sistemi che le persone trovino utili”, ha dichiarato Tom Brown, co-fondatore di Anthropic. “Ci aspettiamo che le istanze P5 offrano notevoli vantaggi in termini di rapporto qualità-prezzo rispetto alle istanze P4d, e saranno disponibili su una scala enorme richiesta per la costruzione di LLM di prossima generazione e prodotti correlati”.

Cohere, un pioniere leader nell’IA linguistica, permette a ogni sviluppatore e azienda di costruire prodotti con tecnologia di elaborazione del linguaggio naturale (NLP) leader mondiale mantenendo i propri dati privati e sicuri.

“Cohere guida l’innovazione nell’aiutare ogni azienda a sfruttare il potere dell’IA linguistica per esplorare, generare, cercare e agire sulle informazioni in modo naturale e intuitivo, distribuendo su più piattaforme cloud nell’ambiente dati che funziona meglio per ogni cliente”, ha detto Aidan Gomez, CEO di Cohere. “Le istanze Amazon EC2 P5 alimentate da NVIDIA H100 sbloccheranno la capacità delle aziende di creare, crescere e scalare più velocemente grazie alla potenza di calcolo combinata con le capacità di LLM e IA generative all’avanguardia di Cohere”.

D’altra parte, Hugging Face ha come obiettivo la democratizzazione del buon machine learning.

“Come la comunità open source a più rapida crescita per l’apprendimento automatico, offriamo ora oltre 150.000 modelli preaddestrati e 25.000 set di dati sulla nostra piattaforma per NLP, visione artificiale, biologia, apprendimento per rinforzo e altro ancora”, ha detto Julien Chaumond, CTO e co-fondatore di Hugging Face. “Non vediamo l’ora di utilizzare le istanze Amazon EC2 P5 tramite Amazon SageMaker su larga scala in UltraClusters con EFA per accelerare la distribuzione di nuovi modelli AI fondamentali per tutti”.

Oggi, più di 450 milioni di persone in tutto il mondo utilizzano Pinterest come piattaforma di ispirazione visiva per fare shopping di prodotti personalizzati al proprio gusto, trovare idee e scoprire creatori stimolanti.

“Utilizziamo l’apprendimento profondo ampiamente su tutta la nostra piattaforma per casi d’uso come l’etichettatura e la categorizzazione di miliardi di foto caricate sulla nostra piattaforma e la ricerca visiva che offre ai nostri utenti la possibilità di passare dall’ispirazione all’azione”, ha detto David Chaiken, architetto capo di Pinterest. “Non vediamo l’ora di utilizzare le istanze Amazon EC2 P5 dotate di GPU NVIDIA H100, AWS EFA e UltraClusters per accelerare lo sviluppo dei nostri prodotti e offrire nuove esperienze basate sull’IA empatica ai nostri clienti”.

Scopri di più sulle nuove istanze AWS P5 alimentate da NVIDIA H100.