Presentazione di tre nuove istanze Amazon EC2 basate su GPU NVIDIA

Introduzione di tre nuove istanze Amazon EC2 basate su GPU NVIDIA

Amazon Elastic Compute Cloud (Amazon EC2) offre la più ampia scelta di acceleratori per alimentare i carichi di lavoro di intelligenza artificiale (AI), apprendimento automatico (ML), grafica ed elaborazione ad alte prestazioni (HPC). Siamo lieti di annunciare l’ampliamento di questa gamma con tre nuove istanze dotate delle ultime GPU NVIDIA: istanze Amazon EC2 P5e alimentate da GPU NVIDIA H200, istanze Amazon EC2 G6 con GPU NVIDIA L4 e istanze Amazon EC2 G6e con GPU NVIDIA L40S. Tutte e tre le istanze saranno disponibili nel 2024 e non vediamo l’ora di vedere cosa potrete fare con esse.

AWS e NVIDIA collaborano da oltre 13 anni e sono stati pionieri nella realizzazione di soluzioni basate su GPU su larga scala, ad alte prestazioni ed economiche per sviluppatori e aziende in tutti i settori. Abbiamo combinato le potenti GPU di NVIDIA con tecnologie AWS differenziate come il sistema Nitro di AWS, 3.200 Gbps di Elastic Fabric Adapter (EFA) v2 di networking, centinaia di GB/s di throughput dati con Amazon FSx for Lustre e calcolo di esascale con gli UltraCluster Amazon EC2 per offrire l’infrastruttura più performante per AI/ML, grafica e HPC. Associati ad altri servizi gestiti come Amazon Bedrock, Amazon SageMaker e Amazon Elastic Kubernetes Service (Amazon EKS), queste istanze forniscono agli sviluppatori la migliore piattaforma del settore per la creazione e la distribuzione di applicazioni generative AI, HPC e grafiche.

Istanze basate su GPU ad alte prestazioni ed economiche per AI, HPC e carichi di lavoro di grafica

Per alimentare lo sviluppo, l’addestramento e l’inferenza dei modelli linguistici di grande dimensione (LLM), le istanze EC2 P5e presenteranno le ultime GPU NVIDIA H200, che offrono 141 GB di memoria GPU HBM3e, 1,7 volte più grande e 1,4 volte più veloce rispetto alle GPU H100. Questo aumento della memoria GPU insieme a una velocità di networking EFA fino a 3200 Gbps abilitata dal sistema Nitro di AWS vi consentiranno di continuare a creare, addestrare e distribuire i vostri modelli all’avanguardia su AWS.

Le istanze EC2 G6e, con GPU NVIDIA L40S, sono state progettate per offrire agli sviluppatori un’opzione ampiamente disponibile per l’addestramento e l’inferenza di LLM pubblicamente disponibili, nonché per supportare l’adozione crescente di piccoli modelli linguistici (SLM). Sono inoltre ottimali per le applicazioni twin digitali che utilizzano NVIDIA Omniverse per descrivere e simulare strumenti e applicazioni 3D e per creare mondi virtuali e flussi di lavoro avanzati per la digitalizzazione industriale.

Le istanze EC2 G6, dotate di GPU NVIDIA L4, offriranno una soluzione più economica ed efficiente dal punto di vista energetico per la distribuzione di modelli di ML per l’elaborazione del linguaggio naturale, la traduzione, l’analisi video e delle immagini, il riconoscimento vocale e personalizzazione, nonché i carichi di lavoro di grafica, come la creazione e il rendering di grafica in tempo reale di qualità cinematografica e lo streaming di giochi.