Incontra NexusRaven-V2 un 13B LLM che supera GPT-4 nel richiamo di funzioni a zero-shot e ha la capacità di trasformare istruzioni in linguaggio naturale in codice eseguibile.

Incontra NexusRaven-V2, il 13B LLM che supera GPT-4 nel richiamo di funzioni a zero-shot e trasforma istruzioni in linguaggio naturale in codice eseguibile

LLM possono essere regolati sui set di dati relativi al codice per generare frammenti di codice, inclusi le chiamate alle funzioni. Questi modelli possono suggerire o generare codice che coinvolge chiamate alle funzioni in base all’input fornito, fornendo contesto o suggerimenti. I modelli di linguaggio possono essere utilizzati per comprendere il linguaggio naturale delle query o delle istruzioni relative al codice. Gli sviluppatori possono inserire domande o descrizioni e il modello può interpretarle per fornire chiamate alle funzioni o segmenti di codice pertinenti come risposte.

LLM possono assistere nel completamento del codice proponendo chiamate alle funzioni o suggerendo funzioni pertinenti in base al contesto o al codice parziale fornito. Ciò aiuta gli sviluppatori a scrivere codice più rapidamente e con maggiore precisione. LLM possono aiutare a guidare API o procedure appropriate in base a un determinato compito o descrizione del problema, aiutando gli sviluppatori a trovare le funzioni corrette da chiamare nel proprio codice. L’integrazione di LLM negli ambienti di sviluppo può offrire assistenza in tempo reale agli sviluppatori, guidandoli su chiamate alle funzioni, tipi di parametri o potenziali errori.

I ricercatori di Nexusflow propongono un modello LLM open-source, NexusRaven-V2. Può trasformare istruzioni in linguaggio naturale in codice eseguibile per utilizzare strumenti. L’API di assistente OpenAI serve come chiave per abilitare copiloti e agenti nell’uso di strumenti software. NexusRaven-V2 mira a migliorare i modelli open-source per copiloti e agenti.

NexusRaven-V2 supera GPT-4 fino al 7% nei tassi di successo delle chiamate alle funzioni nei casi d’uso generati dall’uomo che coinvolgono funzioni nidificate e composite. NexusRaven è stato sintonizzato con l’istruzione Meta’s CodeLlama-13 B. Utilizza le pipeline di Nexusflow per reperire esclusivamente corpora di codice aperto senza utilizzare LLM proprietari. È commercialmente permissivo sia per sviluppatori della comunità che per le aziende.

E’ stato osservato che NexusRaven-V2 supera l’ultimo modello GPT-4 di un 4% in termini di tasso di successo nella chiamata alle funzioni in media nel nostro benchmark curato dall’uomo. È importante notare che in 4 compiti impegnativi che richiedono chiamate alle funzioni nidificate e composite. Inoltre, NexusRaven-V2 mostra una maggiore robustezza rispetto a GPT-4 quando si gestiscono variazioni nelle descrizioni delle funzioni fornite dagli sviluppatori.

Il team ha rilasciato artefatti di utilità open-source che consentono agli utenti di sostituire senza soluzione di continuità le API proprietarie di chiamata alle funzioni mainstream con NexusRaven-V2 nel loro flusso di lavoro software. Forniscono anche demo online demos e notebook Colab per la formazione e la dimostrazione di integrazione. Pubblicano il loro benchmark di valutazione open-source Nexus-Function-Calling e stabiliscono una classifica Huggingface, che include una vasta raccolta di esempi di chiamata alle funzioni curati dall’uomo, che coprono varie casistiche e difficoltà delle chiamate alle funzioni.

In futuro, le LLM per la chiamata alle funzioni potrebbero beneficiare dai contesti educativi fornendo agli studenti assistenza in tempo reale, guidandoli nell’invocazione corretta delle funzioni, aiutando così nella comprensione dei concetti di programmazione.