Cosa possiamo aspettarci da GPT-5?

What to expect from GPT-5?

Il momento che tutti aspettavamo – GPT-5 e le impressionanti capacità del suo predecessore, GPT-4.

Può sembrare molto difficile tenere il passo con il rapido movimento nell’ambito dell’AI e della tecnologia. Ogni settimana o mese, qualcosa di nuovo esce e ora sei qui a imparare qualcosa di nuovo, di nuovo!

Questa volta si tratta di GPT-5.

GPT-4 è stato rilasciato nel marzo del 2023, e da allora tutti aspettano il rilascio di GPT-5. Siqi Chen ha twittato il 27 marzo dicendo che “gpt5 è programmato per completare l’addestramento a dicembre”. Tuttavia, questa affermazione è stata chiarita dal CEO di OpenAI Sam Altman in un evento MIT nell’aprile quando gli è stato chiesto di GPT-5 dichiarando “Non siamo e non lo saremo per un po’ di tempo”.

Questo chiarisce la situazione. Tuttavia, alcuni esperti hanno suggerito che OpenAI rilasci un GPT-4.5, un rilascio intermedio tra GPT-4 e GPT-5 entro il Q3/Q4 del 2023. Miglioramenti vengono sempre apportati ai modelli attuali e questo potrebbe essere un potenziale rilascio di GPT-4.5. Molti sostengono che GPT-4.5 abbia un potenziale di capacità multimodale, che è già stato dimostrato nella live stream dello sviluppatore di GPT-4 nel marzo del 2023.

Anche se ci sono grandi aspettative per GPT-5, GPT-4 ha ancora bisogno di sistemare alcune cose. Ad esempio, il tempo di inferenza di GPT-4 è molto alto, insieme al fatto che è computazionalmente costoso da eseguire. Ci sono altre sfide come l’accesso alle API di GPT-4.

Anche se c’è del lavoro da fare, ciò che possiamo dire è che ogni rilascio di GPT ha spinto i confini della tecnologia AI e di ciò di cui è capace. Gli appassionati di AI sono entusiasti di esplorare le funzionalità innovative di GPT-5.

Quindi, quali sono le funzionalità che possiamo aspettarci da GPT-5? Scopriamolo.

Hallucinazioni ridotte

Si tratta di una questione di fiducia, la principale ragione per cui la maggior parte degli utenti non crede nei modelli AI. Ad esempio, GPT-4 ha ottenuto un punteggio del 40% superiore rispetto a GPT-3.5 nelle valutazioni di fatto interne in tutte e nove le categorie, come mostrato nell’immagine sottostante. Ciò significa che GPT-4 è meno probabile che risponda a contenuti non consentiti, e il 40% più probabile di produrre risposte fattuali, rispetto a GPT-3.5.

Come i nuovi rilasci continueranno a migliorare le sfide attuali, si dice che GPT-5 ridurrà le allucinazioni a meno del 10%, rendendo gli LLMs più affidabili.

Efficienza di calcolo

Come detto in precedenza, GPT-4 è molto costoso dal punto di vista computazionale, a $0,03 per token. Questo in confronto al costo di GPT-3.5 di $0,0002. Questa è una grande differenza. GPT-4, addestrato su un dataset di un trilione di parametri e infrastruttura, riflette il costo.

Mentre il modello PaLM 2 di Google è addestrato solo su 340 miliardi di parametri e ha un’efficienza efficiente. Se OpenAI pianifica di competere con PaLM 2 di Google, dovrà cercare modi per ridurre il costo e le dimensioni dei parametri di GPT-4, mantenendo al contempo le prestazioni.

Un altro aspetto da considerare è un miglior tempo di inferenza, ovvero il tempo che ci vuole per un modello di deep learning per prevedere nuovi dati. Più funzionalità e plugin ci sono in GPT-4, maggiori diventano l’efficienza di calcolo. Gli sviluppatori si lamentano già con OpenAI che le API di GPT-4 smettono frequentemente di rispondere, il che li costringe ad utilizzare GPT-3.5.

Considerando tutto ciò, possiamo aspettarci che OpenAI superi queste sfide con un rilascio di GPT-5 che sia più piccolo, più economico e più efficiente.

Multi-sensoriale

Nel periodo che ha preceduto il rilascio di GPT-4, molte persone erano entusiaste delle sue capacità multimodali. Anche se non è stato ancora aggiunto a GPT-4, questo è dove GPT-5 potrebbe arrivare e essere la star dello spettacolo e renderlo veramente multimodale.

Non solo possiamo aspettarci che si occupi di immagini e testo, ma anche di audio, video, temperature e altro ancora. Sam Altman ha dichiarato in un’intervista: “Sono molto eccitato di vedere cosa succede quando possiamo fare video, ci sono molti contenuti video nel mondo. Ci sono molte cose che sono molto più facili da imparare con un video che con il testo”.

Aumentare il tipo di dati che possono essere utilizzati per rendere le conversazioni più dinamiche e interattive. Le capacità multimodali saranno il collegamento più veloce all’Intelligenza Artificiale Generale (AGI).

Memoria a lungo termine

La lunghezza massima dei token di GPT-4 è di 32mila token, il che è stato impressionante. Ma con il mondo che rilascia modello dopo modello, abbiamo modelli come Story Writer che possono produrre 65mila token.

Per stare al passo con la concorrenza attuale, ci aspettiamo che GPT-5 introduca una maggiore lunghezza di contesto, consentendo agli utenti di avere amici basati sull’IA che possano ricordare la loro personalità e la loro storia per anni.

Miglioramento della comprensione contestuale

Essendo un grande modello di lingua (LLM), la prima cosa che possiamo aspettarci è un miglioramento e una maggiore capacità di comprendere il contesto. Se uniamo questo al punto precedente sulla memoria a lungo termine, GPT-5 potrebbe avere il potenziale per mantenere il contesto durante lunghe conversazioni. Come utente, avrai risposte più mirate e significative che sono coerenti con i tuoi requisiti.

Con questo arriva una comprensione del linguaggio più avanzata, con il componente principale del linguaggio naturale che è l’emozione. Le potenziali capacità di comprensione contestuale in GPT-5 possono consentirgli di essere più empatico e produrre risposte appropriate per continuare a impegnarsi nella conversazione.

Conclusione

C’è ancora molto da scoprire sulle potenziali capacità di GPT-5, e non saremo in grado di trovare ulteriori informazioni fino alla sua uscita. Questo articolo si basa sulle sfide attuali che GPT-4 e GPT-3.5 affrontano, e su come OpenAI possa utilizzare questi ostacoli per superarli e produrre un rilascio ad alta performance di GPT-5. Nisha Arya è una Data Scientist, Freelance Technical Writer e Community Manager presso Nisoo. È particolarmente interessata a fornire consigli o tutorial sulla carriera in Data Science e conoscenze basate sulla teoria intorno alla Data Science. Desidera anche esplorare i diversi modi in cui l’Intelligenza Artificiale può beneficiare della longevità della vita umana. Una studentessa appassionata, in cerca di ampliare le sue conoscenze tecniche e di scrittura, aiutando nel frattempo a guidare gli altri.