StarCoder l’Assistente di Codifica Che Hai Sempre Desiderato.

StarCoder l'assistente di codifica che desideravi.

Lascia che l’AI avanzata si occupi del completamento del codice, della formattazione, della traduzione e della correzione di bug. Puoi anche chattare con uno StarChat e utilizzare le estensioni di VSCode per il lavoro.

Cos’è un StarCoder?

Lo StarCoder è un modello di linguaggio di grandi dimensioni all’avanguardia progettato appositamente per il codice. Con impressionanti 15,5B di parametri e una lunghezza estesa del contesto di 8K, eccelle nelle capacità di infilling e facilita l’elaborazione rapida di grandi batch attraverso l’attenzione multi-query.

StarCoderBase è stato allenato su un vasto dataset di 1 trilione di token derivati da The Stack . Questa collezione è costituita da repository GitHub con licenze permissive, accompagnati da strumenti di ispezione e un processo di opt-out per sviluppatori attenti alla privacy. Per migliorare ulteriormente le sue prestazioni, il team di BigCode ha meticolosamente raffinato StarCoderBase utilizzando 35B di token Python.

Di conseguenza, StarCoder emerge come un potente e raffinato modello di linguaggio dotato di capacità notevole per gestire una vasta gamma di compiti di codifica con notevole competenza.

StarCoderBase supera tutti i modelli di linguaggio di codice open-source esistenti che offrono supporto per più linguaggi di programmazione e dimostra prestazioni eccezionali, addirittura superando il famoso modello OpenAI code-cushman-001 in termini di qualità e risultati. Inoltre, StarCoder può essere sollecitato a raggiungere il 40% di pass@1 su HumanEval. Supera i modelli LaMDA, LLaMA e PaLM.

Leggi il paper di ricerca per saperne di più sulla valutazione del modello.

Completamento del codice di StartCoder

Il playground di completamento del codice di BigCode – StarCoder è un ottimo modo per testare le capacità del modello. Puoi giocare con vari formati del modello, prefissi e riempitivi per avere l’esperienza completa.

A mio parere, è uno strumento fantastico per il completamento del codice, specialmente per il codice Python. Tuttavia, ha alcuni svantaggi, come le API obsolete, le allucinazioni, la visualizzazione dei metadati di Jupyter Notebook e il codice incompleto.

Il modo migliore per generare codice con StarCoder è utilizzare commenti ben spiegati. Aiuterà il modello a capire meglio ciò che stai cercando di fare e a generare risultati più accurati.

StarChat Playground

Se sei abituato allo stile di ChatGPT per generare codice, dovresti provare StarChat per generare e ottimizzare il codice.

StarChat è una versione specializzata di StarCoderBase che è stata raffinata sui dataset di Dolly e OpenAssistant, risultando in un assistente di codifica veramente prezioso. È un modello di 16 miliardi di parametri pre-allenato su un trilione di token provenienti da oltre 80 linguaggi di programmazione, problemi di GitHub, commit Git e notebook Jupyter.

Puoi fornire l’istruzione a StarChat e produrrà il codice con la spiegazione. Puoi anche utilizzare prompt di continuazione per modificare il codice.

HF Code Autocomplete

HF Code Autocomplete è un’alternativa gratuita e open-source a GitHub Copilot che è alimentata da StarCoder. Lo sto utilizzando sin dal suo lancio e sono abbastanza impressionato dalla sua velocità e precisione.

Funziona con Jupyter Notebook e tutti i tipi di file in VSCode. Devi solo installare l’estensione dal marketplace e aggiungere l’API di Hugging Face.

Conclusioni

Siamo costantemente alla ricerca di assistenti di codice avanzati sul nostro posto di lavoro, che possano gestire efficacemente script ripetitivi mentre assistono nella creazione di sistemi più complessi.

In questo blog, abbiamo esplorato a fondo StarCoder e la sua vasta gamma di applicazioni. Vale la pena notare che la comunità open-source è instancabilmente dedicata a spingere i confini dell’assistenza al codice, cercando costantemente di fornire soluzioni innovative che migliorino la nostra esperienza di codifica e la nostra produttività.

Spero che tu abbia apprezzato la lettura di questo blog e l’abbia trovato informativo e illuminante. Seguimi su LinkedIn se vuoi saperne di più sulle ultime tecnologie dell’AI. Abid Ali Awan (@1abidaliawan) è un professionista certificato in scienze dei dati che ama costruire modelli di machine learning. Al momento, si sta concentrando sulla creazione di contenuti e sulla scrittura di blog tecnici sulle tecnologie di machine learning e data science. Abid ha una laurea magistrale in gestione della tecnologia e una laurea triennale in ingegneria delle telecomunicazioni. La sua visione è quella di costruire un prodotto di AI utilizzando una rete neurale a grafo per gli studenti che lottano con la malattia mentale.