Incontra SQLCoder un nuovo modello open source all’avanguardia per la conversione di domande in linguaggio naturale in query SQL

Incontra SQLCoder, un nuovo modello open source all'avanguardia per la conversione di domande in SQL.

Defog.ai ha rilasciato SQLCoder, un modello all’avanguardia per tradurre domande in linguaggio naturale in query di database. Rispetto agli schemi SQL generici in Postgres, SQLCoder batte nettamente tutti i principali modelli open-source. Quando ottimizzato per uno schema di database specifico, supera le prestazioni di gpt-4.

La dimensione del modello è tale che può essere eseguito in float a 16 bit su una singola GPU A100-40GB o in quantizzazione a 8 bit su una GPU consumer di fascia alta (come ad esempio una RTX 3090/4090). Anche il meccanismo di valutazione per SQL generato da LLM è reso open-source. Valutare il codice SQL può essere difficile. I ricercatori desiderano condurre test estesi, pubblici e riproducibili per spingere i limiti dei sistemi open-source di traduzione di testo in SQL.

I pesi del modello sono concessi in licenza CC BY-SA 4.0. Il modello è gratuito sia per uso personale che commerciale. Se modifichi le conseguenze (ad esempio mediante il fine-tuning), devi pubblicare tali modifiche come open-source con la stessa licenza.

SQLCoder è una versione ottimizzata di StarCoder che utilizza 15 miliardi di parametri. SQLCoder è stato ottimizzato per interrogazioni SQL progressivamente complesse create manualmente. L’ottimizzazione specifica dello schema del database consente di ottenere o superare le prestazioni di GPT-4.

Negli ultimi tre mesi, i ricercatori hanno utilizzato SQLCoder con clienti enterprise nei settori sanitario, servizi finanziari e governativi. I modelli self-hosted sono l’unica opzione per i clienti che non vogliono che i dati sensibili lascino i loro server quando utilizzano LLM.

Il modello è stato affinato in due fasi dal team di ricerca. Hanno perfezionato il modello fondamentale di StarCoder utilizzando solo le nostre query di lieve o moderata complessità. Il modello risultante, defog-easy, è stato quindi ottimizzato per domande difficili ed estremamente difficili per produrre SQLCoder. Nelle nostre prove, SQLCoder supera quasi tutti i modelli popolari ad eccezione di GPT-4. In particolare, supera modelli più grandi di dieci volte, come gpt-3.5-turbo e text-da-vinci-003. Questi risultati rappresentano solo le prestazioni di SQLCoder su database SQL generici e non su schemi di database specifici. Quando SQLCoder è ottimizzato per schemi di database particolari, può superare GPT-4 di OpenAI con una latenza inferiore.

Una versione open-source di SQLCoder può essere trovata su https://github.com/defog-ai/sqlcoder. Ha molte potenziali applicazioni, come:

  • Testarlo nel proprio ambiente di sviluppo
  • Eseguirlo nel cloud
  • Farlo lavorare con altri programmi

SQLCoder è un programma robusto che può semplificare e automatizzare le operazioni di elaborazione dei dati. Interroga facilmente il database utilizzando SQLCoder, che traduce le domande in linguaggio naturale in query SQL.

Utilizzare SQLCoder può aiutarti in vari modi.

  • L’accuratezza di SQLCoder è tale da poter costruire query SQL corrette ed efficienti.
  • SQLCoder è efficiente nel produrre rapidamente e senza sforzo query SQL.
  • SQLCoder produce query scritte secondo le regole di SQL.
  • L’adattabilità di SQLCoder significa che può essere modificato per soddisfare i requisiti del tuo programma.