Il nuovo rivale di ChatGPT Gemini di Google

Il nuovo concorrente di ChatGPT Gemini di Google

 

Da un po’ di tempo, ChatGPT è stato al centro dell’attenzione. Tutti ne parlano e molte persone lo stanno usando, cosa potrebbe andare storto?

Google ha sempre puntato a mantenere la sua reputazione di essere un’azienda orientata all’intelligenza artificiale, e finora ci è riuscita bene. Tuttavia, nell’ultimo anno, è evidente dire che OpenAI ha preso il sopravvento con ChatGPT ed era solo questione di tempo prima che Google entrasse in gioco per cercare di riprendere il comando.

Il CEO Sundar Pichai ha dichiarato che:

Uno dei motivi per cui ci siamo interessati all’intelligenza artificiale fin dall’inizio è che abbiamo sempre visto la nostra missione come una missione senza tempo.

 

Vi presentiamo Gemini di Google. 

Se non avete ancora avuto la possibilità di guardare il trailer, vi consiglio di guardarlo qui. 

 

Cos’è Gemini?

 

Gemini è il più grande modello di linguaggio di Google, che il CEO Pichai ha inizialmente testato per la prima volta in una conferenza a giugno ed è ora ufficialmente lanciato al pubblico. Quindi, cosa c’è di così fantastico in Gemini e perché fa tremare ChatGPT?

Gemini non è solo un singolo modello di intelligenza artificiale. Esistono diverse varianti per soddisfare diverse esigenze. Ad esempio, c’è la versione più leggera chiamata Gemini Nano che è compatibile con i dispositivi Android. C’è anche Gemini Pro che utilizza la base di Barb e sarà utilizzato per alimentare molti servizi di intelligenza artificiale di Google.

Ma non finisce qui. C’è anche Gemini Ultra, che è il modello più potente e capace di Google fino ad ora. Gemini Ultra sembra essere stato specificamente progettato per i data center e le applicazioni aziendali.

Ecco una breve spiegazione:

  • Gemini Ultra – il modello più grande e potente per compiti altamente complessi.
  • Gemini Pro – il miglior modello per la scalabilità su un’ampia gamma di compiti.
  • Gemini Nano – il modello più efficiente per i compiti sui dispositivi.

Questa famiglia di 3 varianti di grandi modelli di linguaggio è stata creata per comprendere e operare su diversi tipi di informazioni. LLM è in grado di gestire diversi tipi di informazioni come testo, codice, immagini, audio e video. La multimodalità al suo meglio.

Quindi, quanto è bravo?

 

La Performance di Gemini

 

Google ha lavorato molto per testare i modelli di Gemini per assicurarsi che soddisfino i requisiti e sono stati rigorosamente valutati su una varietà di compiti. Si dice che Gemini Ultra di Google abbia superato i risultati attuali dello stato dell’arte su 30 dei 32 benchmark accademici ampiamente utilizzati nella ricerca di LLM, con un impressionante punteggio del 90,0%.

  

Gemini Ultra si è dimostrato il primo modello che supera gli esperti umani nella comprensione del linguaggio multitask MMLU (massive multitask language understanding). MMLU combina 57 argomenti che includono matematica, storia, legge, medicina, fisica e altri per testare le conoscenze del mondo e le capacità di risoluzione dei problemi.

Analizzando questi benchmark, possiamo vedere che il più grande vantaggio di Gemini è la sua capacità di comprendere e interagire con video e audio.

Abbiamo visto OpenAI cercare di raggiungere questo traguardo con la creazione di DALL-E e Whisper. Tuttavia, Google è andata un passo oltre con un modello multisensoriale fin dall’inizio. Google ha anche menzionato i miglioramenti nella codifica grazie a un nuovo sistema di generazione del codice chiamato AlphaCode 2, che dovrebbe funzionare in modo più efficiente dell’85% rispetto ad altri partecipanti a competizioni di codifica.

Detto questo, i benchmark sono solo benchmark. Potremo capire appieno le capacità di Gemini quando gli utenti quotidiani interagiranno con esso.

Se vuoi saperne di più sulle capacità di Gemini, guarda questo video:

Come accedere a Gemini

Per gli utenti di Pixel 8 Pro, potresti aver già visto alcune nuove funzionalità come la funzione di auto-sommario nell’app Recorder e la risposta intelligente nella tastiera Gboard, grazie a Gemini Nano.

Se sei ansioso di provare Gemini Pro, puoi farlo ora con Bard. Sviluppatori e clienti aziendali potranno anche accedere a Gemini Pro tramite Google Generative AI Studio o Vertex AI in Google Cloud a partire dal 13 dicembre.

Se sei interessato a Gemini Nano, potrebbe essere necessario attendere un po’ di più poiché sarà disponibile l’anno prossimo.

È importante notare che al momento Gemini è disponibile solo in inglese. Saranno disponibili altre lingue, poiché il CEO Pichai ha dichiarato che l’azienda mira a integrare il modello nel motore di ricerca di Google, nei prodotti pubblicitari, nel browser Chrome e altro ancora.

Conclusioni

Questo sembra essere il momento di Google per riprendersi la corona e mostrarci perché erano all’avanguardia dell’innovazione dell’IA. Cosa ne pensi che emergerà successivamente?

****[Nisha Arya](https://www.linkedin.com/in/nisha-arya-ahmed/)**** è una Data Scientist e una scrittrice tecnica freelance. È particolarmente interessata a fornire consigli di carriera o tutorial sulla Data Science e conoscenze teoriche sulla Data Science. Desidera anche esplorare i diversi modi in cui l’intelligenza artificiale può beneficiare della longevità della vita umana. Un’appassionata studentessa, desiderosa di ampliare le sue conoscenze tecniche e le sue capacità di scrittura, mentre aiuta a guidare gli altri.