Learn more about Thesequence
All’interno di FunSearch il nuovo LLM di Google DeepMind in grado di scoprire nuovi algoritmi di matematica e informatica
Scoprire nuove scienze potrebbe essere il Turing Test più completo per modelli di intelligenza artificiale. I nuovi m...
Cosa sappiamo su Mixtral 8x7B Mistral Nuovo LLM Open Source
Mistral AI è una delle aziende più innovative che spingono i limiti degli LLM open-source. La prima release di Mistra...
Dentro Orca 2 il nuovo metodo di Microsoft per insegnare il ragionamento ai piccoli modelli di lingua
All'inizio di quest'anno, Microsoft Research ha presentato Orca, un modello con 13 miliardi di parametri in grado di ...
Dentro Ghostbuster il nuovo metodo dell’Università di Berkeley per rilevare i contenuti generati da intelligenza artificiale
La rapida evoluzione dei modelli di linguaggio di grandi dimensioni (LLM) ha creato nuove sfide in termini di differe...
All’interno di Zephyr-7B l’LLM iperottimizzato di HuggingFace che continua a superare modelli più grandi
ZEPHYR-7B è uno dei nuovi grandi modelli di linguaggio (LLM) della nuova generazione che sono stati incredibilmente b...
All’interno di COSP e USP Google ricerca nuovi metodi per migliorare il ragionamento nelle LLMs
L'evoluzione della generazione di prompt è uno dei fondamentali elementi costitutivi delle applicazioni basate su LLM...
All’interno di LlaVA la prima alternativa open source a GPT-4V
Alcune settimane fa, OpenAI ha presentato nuove capacità di elaborazione delle immagini e dell'audio in GPT-4. Fondam...
Incontra Fuyu-8B il modello di fondotinta molto particolare dietro la piattaforma Adept.
Adept.ai fa parte della generazione di nuovi unicorni dell'IA appena nati. Inizialmente incubato da alcuni degli auto...
Chi è Harry Potter? All’interno del metodo di affinamento di Microsoft Research per dissociare i concetti nelle LLM
I grandi modelli linguistici (LLM) vengono regolarmente addestrati con enormi quantità di dati non etichettati, cosa ...
Dentro PromptBreeder la nuova tecnica di Google DeepMind per auto-miglioramento dei prompt
La ragionamento e l'evoluzione/ottimizzazione veloce stanno venendo riconosciute come la prossima significativa front...
L’architettura di incorporazione di LinkedIn che alimenta le sue capacità di ricerca di lavoro
Gli embedding sono diventati uno dei componenti più importanti delle applicazioni di modelli linguistici di grandi di...
All’interno di AGENTS il nuovo framework open source per la creazione di agenti LLM semi-autonomi
Gli agenti autonomi sono uno degli argomenti più popolari nell'ecosistema del modello fondamentale. Le prime iterazio...
Comprensione di Flash-Attention e Flash-Attention-2 La via per aumentare la lunghezza del contesto dei modelli di linguaggio.
La scalabilità del contesto dei grandi modelli di linguaggio (LLM) rimane una delle sfide più grandi per espandere l'...
Microsoft Research presenta non uno, non due, ma quattro nuovi compilatori di intelligenza artificiale
I compilatori stanno vivendo una rinascita nell'era dell'AI generativa. Nel contesto dell'AI, un compilatore è respon...
All’interno di DSPy il nuovo framework di programmazione per modelli di linguaggio di cui hai bisogno di sapere
L'universo dei framework per la programmazione dei modelli di linguaggio (LMP) si è espanso rapidamente negli ultimi ...
- You may be interested
- 5 corsi universitari gratuiti su Data A...
- AudioLDM 2, ma più veloce ⚡️
- Grandi modelli di linguaggio sorprendon...
- Rinventare un’architettura di fed...
- Codifica efficace con date e orari in P...
- Differenziabilità di una Funzione Data ...
- Progettazione di modelli di architettur...
- Cosa significa Prompt Tuning?
- Guida passo-passo per la creazione di u...
- Un’introduzione semplice al Bayes...
- Una gentile introduzione alle Support V...
- Quantizzazione e co. Riduzione dei temp...
- Cosa vecchia è nuova di nuovo
- Perché i progetti di dati non riescono ...
- Principali librerie di elaborazione del...