Microsoft presenta Orca2, creando il primo Ragionatore Cauteloso LLM

Microsoft presenta Orca2, il primo Ragionatore Cauteloso LLM

Una svolta logica

Come abbiamo discusso la settimana scorsa, i modelli di lingua piccoli (SLM) sono molto popolari in questo momento.

Inoltre, Microsoft ha lanciato la nuova versione del loro gioiello della corona SLM, Orca2, creando un nuovo tipo di modello di linguaggio, i Cautious Reasoners.

Hanno stabilito una nuova soglia nell’industria dell’IA battendo modelli fino a 10 volte più grandi in compiti di ragionamento altamente complessi.

Inoltre, hanno fornito una visione chiara della loro strategia di intelligenza artificiale, così come preziosi spunti sul complesso mondo dell’apprendimento dei Transformer.

E oggi, approfondiremo come hanno creato questo nuovo paradigma.

La maggior parte delle intuizioni che condivido in VoAGI è già stata condivisa nella mia newsletter settimanale, TheTechOasis.

Se vuoi essere aggiornato sul frenetico mondo dell’IA e sentirti anche ispirato ad agire o, almeno, essere preparato per il futuro che ci attende, questo è ciò che fa per te.

🏝Iscriviti qui sotto🏝 per diventare un leader dell’IA tra i tuoi colleghi e ricevere contenuti non presenti in nessun’altra piattaforma, inclusa VoAGI:

Iscriviti | TheTechOasis

La newsletter per restare avanti nella campo dell’IA

thetechoasis.beehiiv.com

The Imitation Game

Quando Microsoft ha presentato la prima versione di Orca, il primo modello open-source che era davvero al livello di ChatGPT-3.5, finalmente l’industria dell’IA ha iniziato a prestare attenzione ai modelli più piccoli.

Oggi, l’Orca originale non è solo considerato un’innovazione critica, ma è anche un punto focale nella strategia di Microsoft, poiché si vocifera che l’LLM che si nasconde dietro i Copilot di Microsoft, il discorso del momento nell’industria, non sia ChatGPT ma Orca, a causa dei costi folli per l’esecuzione dei modelli con oltre 100 miliardi di parametri.

La premessa di Microsoft è semplice: se riusciamo a ottenere un modello che ci offre il 90% delle capacità del modello più grande a una frazione del costo, prendiamo quella strada.