Meta rilascia LLaMA 2 Gratuito per uso commerciale

Meta rilascia LLaMA 2 gratuito uso commerciale

Llama 2, la prossima generazione del nostro modello di linguaggio open-source di grandi dimensioni

Questa sarà una rapida, Meta rilascia la nuova versione di LLaMA. Questa versione sarà conosciuta come LLaMA 2 e sarà gratuita sia per la ricerca che per l’uso commerciale. Questo è un rilascio di Meta e Microsoft insieme.

Credo che Microsoft voglia acquisire tutti i modelli di linguaggio di terze parti e mantenerli come SaaS sulla propria piattaforma come offerta commerciale. Ora OpenAI e LLaMA saranno entrambi parte delle offerte di Microsoft.

Cosa c’è di nuovo?

Includiamo pesi del modello e codice di avvio per il modello preaddestrato e le versioni addestrate per la conversazione

Questo significa che non sarà più necessario andare su 4chan per ottenere i pesi e costruire il proprio modello. Sia l’architettura che i pesi del modello saranno gratuiti per l’uso commerciale.

Questo modello è disponibile in 3 versioni —

  • LLaMA-2–7B
  • LLaMA-2–13B
  • LLaMA-2–70B

Tutti questi modelli vengono rilasciati come modello Foundation e modello CHAT correlato. Pertanto saranno rilasciati in totale 6 mesi.

I modelli più piccoli, 7B e 13B, dovrebbero adattarsi a una moderna GPU per consumatori, mentre il modello più grande, 70B, dovrebbe adattarsi all’A100.

  • La lunghezza del contesto è di default 4096 ma può essere aumentata.
  • Il modello è addestrato su 2 trilioni di token.
  • L’architettura di 7B e 13B è simile ai loro fratelli maggiori, ma 70B è un nuovo rilascio.
  • Il modello è addestrato per casi d’uso di chat ed è creato utilizzando il fine-tuning supervisionato utilizzando 100.000 campioni e oltre un milione di preferenze umane.

Benchmarks:

Questo modello dovrebbe avere prestazioni paragonabili alla maggior parte dei modelli open-source. In particolare, rispetto a Falcon-40B (il campione in carica attuale), questo modello ottiene risultati migliori in tutte le attività con un margine significativo.

La serie di Test Standard

Valutazione da parte dei valutatori umani…