Google svela il Cloud TPU v5p e l’AI Hypercomputer un balzo in avanti nella potenza di elaborazione dell’IA

Google svela il Cloud TPU v5p e l'AI Hypercomputer un salto in avanti nella potenza di elaborazione dell'IA

Google ha fatto scalpore con il lancio della sua unità di elaborazione tensoriale, Cloud TPU v5p, accompagnata dalla rivoluzionaria architettura di supercomputer nota come AI Hypercomputer. Questi lanci innovativi, insieme allo strumento di gestione delle risorse Dynamic Workload Scheduler, segnano un passo avanti importante nel trattamento delle attività di intelligenza artificiale per le organizzazioni.

Il Cloud TPU v5p, successore del v5e lanciato di recente a novembre, si distingue come il TPU più potente di Google. A differenza del suo predecessore, il v5p vanta un design orientato alle prestazioni, promettendo notevoli miglioramenti nelle capacità di elaborazione. Con 8.960 chip per pod e una velocità di interconnessione di 4.800 Gbps tra i chip, questa iterazione offre il doppio delle FLOPS e un’impressionante triplicazione della memoria ad alta larghezza di banda (HBM) rispetto al precedente TPU v4.

La concentrazione sulle prestazioni ripaga significativamente, con il Cloud TPU v5p che mostra uno straordinario miglioramento del 2,8 volte rispetto al TPU v4 durante l’addestramento di modelli LLM di grandi dimensioni. Inoltre, sfruttando i SparseCores di seconda generazione, il v5p presenta una velocità di addestramento che è 1,9 volte più veloce per i modelli densi incorporati rispetto al suo predecessore.

Parallelamente, l’AI Hypercomputer emerge come un elemento rivoluzionario nelle architetture dei supercomputer. Esso amalgama hardware per prestazioni ottimizzate, software open-source, importanti framework di apprendimento automatico e modelli di consumo adattabili. Abbandonando l’approccio convenzionale di rinforzare componenti discrete, l’AI Hypercomputer sfrutta un design di sistema collaborativo per aumentare l’efficienza e la produttività dell’intelligenza artificiale nell’addestramento, nella messa a punto e nei domini del servizio.

Questa avanzata architettura presenta un design di calcolo, archiviazione e rete meticolosamente ottimizzato basato su un’infrastruttura di centro dati di dimensioni ultragrandi. Inoltre, offre agli sviluppatori l’accesso all’hardware correlato tramite software open-source, supportando framework di apprendimento automatico come JAX, TensorFlow e PyTorch. L’integrazione si estende a software come Multislice Training e Multihost Inferencing, completata da una profonda integrazione con Google Kubernetes Engine (GKE) e Google Compute Engine.

Ciò che distingue veramente l’AI Hypercomputer è il suo modello di consumo flessibile, specificamente progettato per le attività di intelligenza artificiale. Esso introduce l’innovativo Dynamic Workload Scheduler e modelli di consumo tradizionali come Committed Use Discounts (CUD), On-Demand e Spot. Questa piattaforma di gestione delle risorse e pianificazione delle attività supporta Cloud TPU e Nvidia GPU, ottimizzando la pianificazione di tutti gli acceleratori necessari per ottimizzare le spese dell’utente.

In questo modello, l’opzione Flex Start è ideale per il perfezionamento dei modelli, gli esperimenti, le sessioni di addestramento più brevi, il ragionamento offline e le attività batch. Essa offre un modo economico per richiedere capacità GPU e TPU in preparazione all’esecuzione. Al contrario, la modalità Calendar consente di riservare specifici orari di inizio, adeguandosi alle attività di addestramento e sperimentali che richiedono tempi di inizio e durate precisi che si estendono per 7 o 14 giorni, disponibili all’acquisto fino a 8 settimane in anticipo.

In conclusione, la presentazione da parte di Google di Cloud TPU v5p, AI Hypercomputer e Dynamic Workload Scheduler rappresenta un passo monumentale nelle capacità di elaborazione dell’intelligenza artificiale, aprendo la strada a un nuovo era di prestazioni migliorate, architetture ottimizzate e modelli di consumo flessibili per le attività di intelligenza artificiale. Queste innovazioni promettono di ridefinire il panorama del calcolo dell’intelligenza artificiale e di aprire la strada a avanzamenti innovativi in varie industrie.

L’articolo Google Unveils Cloud TPU v5p and AI Hypercomputer: A Leap in AI Processing Power è apparso per la prima volta su MarkTechPost.