Learn more about Amazon EC2

Presentazione di tre nuove istanze Amazon EC2 basate su GPU NVIDIA

Il portafoglio di calcolo accelerato di Amazon Elastic Compute Cloud (Amazon EC2) offre la più ampia scelta di accele...

L’istanza DL2q di Amazon EC2 per l’inferenza di IA ad alte prestazioni ed a basso costo è ora disponibile in generale.

Questo è un post ospite di A.K Roy di Qualcomm AI. Le istanze DL2q di Amazon Elastic Compute Cloud (Amazon EC2), alim...

Abilita le metriche GPU basate su pod in Amazon CloudWatch

Questo articolo illustra come configurare le metriche GPU basate su container e fornisce un esempio di raccolta di qu...

Massimizza le prestazioni stabili di Diffusion e riduci i costi di inferenza con AWS Inferentia2

I modelli di intelligenza artificiale generativa hanno registrato una crescita rapida negli ultimi mesi grazie alle l...

Accelerare PyTorch con DeepSpeed per allenare grandi modelli di linguaggio con istanze DL1 basate su Intel Habana Gaudi su EC2.

Allenare grandi modelli di lingua (LLM) con miliardi di parametri può essere impegnativo. Oltre a progettare l'archit...