Google svela il suo ultimo modello di intelligenza artificiale Gemini

Google svela Gemini, il suo ultimo modello di intelligenza artificiale

Google DeepMind, CEO e co-fondatore Demis Hassabis e Sundar Pichai, CEO di Google, hanno entrambi presentato Gemini, il tanto atteso modello AI del colosso tecnologico che promette di riformare il panorama dell’intelligenza artificiale. Secondo il post del blog dell’azienda, Gemini promette di offrire capacità all’avanguardia e potrebbe mettere in allerta OpenAI.

Ma cos’è Gemini? Il blog afferma che il modello è il risultato di una collaborazione estesa tra i team di Google. Il suo design multimodale gli consente di comprendere e operare in modo fluido su vari tipi di informazioni, inclusi testo, codice, audio, immagini e video.

Il modello è disponibile in tre configurazioni ottimizzate:

  • Gemini Ultra: Progettato per compiti estremamente complessi, Gemini Ultra è il modello più capace della lineup Gemini.
  • Gemini Pro: Ideale per scalare su un’ampia gamma di compiti, Gemini Pro offre prestazioni e flessibilità di alto livello.
  • Gemini Nano: Progettato per compiti su dispositivi, Gemini Nano è un modello altamente efficiente che garantisce prestazioni ottimali in diverse applicazioni.

E per quanto riguarda le prestazioni? Il team di Google ha testato, utilizzando Gemini Ultra, e ha superato gli esperti umani nel benchmark Massive Multitask Language Understanding (MMLU), ottenendo un impressionante 90,0%.

Inoltre, Gemini Ultra raggiunge un punteggio all’avanguardia del 59,4% nel nuovo benchmark Multimodal Multitask Understanding (MMMU), dimostrando le sue capacità avanzate di ragionamento in diversi ambiti. Ecco un ottimo video sulla sua capacità di ragionare sulla matematica e la fisica:

Ma secondo il team di Google, ciò che distingue Gemini è il suo design nativamente multimodale. Il design rappresenta una deviazione dall’approccio convenzionale di unire componenti separati per diverse modalità. Ciò consente a Gemini di comprendere e ragionare in modo fluido sugli input, superando i modelli multimodali esistenti in quasi tutti i settori.

Le capacità di ragionamento multimodale del modello lo rendono in grado di interpretare informazioni complesse scritte e visive, mentre la sua capacità di generare codice di alta qualità in popolari linguaggi di programmazione lo posiziona come un modello di base leader per i compiti di codifica a livello globale.

La affidabilità, la scalabilità e l’efficienza di Gemini sono ulteriormente potenziate dalla sua formazione sull’infrastruttura ottimizzata per l’IA di Google utilizzando le unità di elaborazione tensoriale (TPU) v4 e v5e. L’introduzione della Cloud TPU v5p, il sistema TPU più potente ad oggi, accelererà lo sviluppo di Gemini, consentendo a sviluppatori e clienti enterprise di addestrare modelli AI su larga scala in modo più rapido ed efficiente.

Google ha anche enfatizzato la sicurezza e la responsabilità come parte dello sviluppo principale di Gemini. Nel blog, hanno spiegato che il modello sta sottoponendosi alle valutazioni di sicurezza più complete di qualsiasi altro modello AI di Google finora. Il loro obiettivo è affrontare i potenziali rischi, inclusi parzialità e tossicità, e hanno coinvolto esperti esterni per fornire diverse prospettive nella valutazione del modello.

Adesso, ovviamente, tutti si chiedono quando sarà possibile utilizzare Gemini. Secondo il team, Gemini 1.0 sarà disponibile su vari prodotti e piattaforme, a partire da Gemini Pro nei prodotti Google; ciò include Bard.

Da qui, gli utenti possono aspettarsi un’esperienza significativamente migliorata, con Gemini che sarà integrato in più servizi Google, inclusi Ricerca, Pubblicità, Chrome e Duet AI nei prossimi mesi. Sviluppatori e clienti enterprise possono accedere a Gemini Pro tramite l’API Gemini in Google AI Studio o Google Cloud Vertex AI, a partire dal 13 dicembre.

I developer di Android avranno anche l’opportunità di sfruttare l’efficienza di Gemini Nano attraverso AICore, disponibile in Android 14. Con il lancio di Gemini, sembra che Google stia puntando a prendere il comando nella corsa all’intelligenza artificiale. Hanno fornito un breve video di introduzione su Gemini qui di seguito: