Adept ha cambiato il gioco multimodale con Fuyu.

Adept ha rivoluzionato il gioco multimodale con Fuyu.

Un impressionante piccolo innovatore

Fonte: autore con DALL-E3

Dammi una migliore dichiarazione di missione per un’azienda rispetto a quella che sto per mostrarti:

Un modello fondamentale in grado di utilizzare ogni strumento software, API e sito web esistente, su comando.

In altre parole, un prodotto software che può fare tutto ciò che gli si chiede.

Tutto.

Ora, ci hanno mostrato uno sguardo anticipato di ciò che stanno costruendo con Fuyu, un modello di linguaggio multimodale che, sebbene molto piccolo rispetto ai modelli all’avanguardia standard, mostra alcune capacità molto impressionanti.

Inoltre, Fuyu arriva con una sorpresa inaspettata che rompe l’attuale consolidamento per la multimodalità e cambia la nostra comprensione su come viene effettivamente raggiunta, grazie a un design nuovo ed elegante ma rivoluzionario.

Questo modello è stato pubblicato originariamente qualche giorno fa nella mia newsletter settimanale gratuita, TheTechOasis.

Se vuoi essere aggiornato sul frenetico mondo dell’IA e sentirti anche ispirato ad agire o, almeno, essere ben preparato per il futuro che ci aspetta, questo fa al caso tuo.

🏝Iscriviti qui sotto🏝 per diventare un leader dell’IA tra i tuoi colleghi e ricevere contenuti non presenti in nessun’altra piattaforma, inclusa VoAGI:

Iscriviti | TheTechOasis

La newsletter per essere avanti nella IA

thetechoasis.beehiiv.com

Non stiamo trascurando qualcosa?

La multimodalità è la prossima grande tendenza nell’IA.

ChatGPT che comprende il nostro testo e risponde è già abbastanza impressionante, ma avere anche un assistente in grado di elaborare immagini è completamente diverso.

ChatGPT-Vision descrive il mio cane come un cucciolo. Fonte: autore

Qui, nonostante interpreti perfettamente quale animale sta vedendo e persino la razza del cane, la cosa più sorprendente è come sia in grado di accennare a…