Prendi il volante NVIDIA NeMo SteerLM consente alle aziende di personalizzare le risposte di un modello durante l’inferenza.

NVIDIA NeMo SteerLM personalizza le risposte di un modello durante l'inferenza

​​I programmatori hanno a disposizione un nuovo volante intelligente alimentato da intelligenza artificiale per aiutarli a guidare modelli di linguaggio di grandi dimensioni (LLM) verso le destinazioni desiderate.

NVIDIA NeMo SteerLM consente alle aziende di definire manopole per regolare le risposte di un modello mentre viene eseguito in produzione, un processo chiamato inferenza. A differenza dei metodi attuali per personalizzare un LLM, consente a una sola esecuzione di addestramento di creare un modello che può servire decine o centinaia di casi d’uso, risparmiando tempo e denaro.

I ricercatori di NVIDIA hanno creato SteerLM per insegnare ai modelli di intelligenza artificiale ciò che gli utenti ritengono importanti, come i segnali stradali da seguire nei loro specifici casi d’uso o mercati. Questi attributi definiti dall’utente possono valutare praticamente qualsiasi cosa, ad esempio il grado di utilità o umorismo nelle risposte del modello.

Un Modello, Diverse Applicazioni

Il risultato è un nuovo livello di flessibilità.

Con SteerLM, gli utenti definiscono tutti gli attributi desiderati e li incorporano in un unico modello. Quindi possono scegliere la combinazione di attributi necessaria per un determinato caso d’uso mentre il modello è in esecuzione.

Ad esempio, un modello personalizzato può ora essere regolato durante l’inferenza alle esigenze uniche di un dipartimento di contabilità, vendite, ingegneria o di un mercato verticale.

Il metodo consente inoltre un ciclo di miglioramento continuo. Le risposte di un modello personalizzato possono servire come dati per un futuro addestramento che ottimizza il modello per nuovi livelli di utilità.

Risparmio di Tempo e Denaro

Fino ad oggi, adattare un modello di intelligenza artificiale generativo alle esigenze di un’applicazione specifica è stato equivalente a ricostruire la trasmissione di un motore. I programmatori dovevano etichettare accuratamente i set di dati, scrivere molto nuovo codice, regolare gli iperparametri all’interno della rete neurale e riaddestrare il modello più volte.

SteerLM sostituisce questi processi complessi e time-consuming con tre semplici passaggi:

  • Utilizzare un set di prompt di base, risposte e attributi desiderati per personalizzare un modello di intelligenza artificiale in grado di predire il comportamento di tali attributi.
  • Generare automaticamente un set di dati utilizzando questo modello.
  • Addestrare il modello con il set di dati utilizzando tecniche standard di addestramento supervisionato.

Diverse Applicazioni Aziendali

I programmatori possono adattare SteerLM a quasi tutte le applicazioni aziendali che richiedono la generazione di testi.

Con SteerLM, un’azienda potrebbe produrre un unico chatbot che può essere adattato in tempo reale ai cambiamenti di atteggiamento, demografici o situazionali dei clienti nei molti mercati verticali o geografie in cui opera.

SteerLM consente anche a un singolo LLM di agire come un copilota flessibile nella scrittura per un’intera azienda.

Ad esempio, gli avvocati possono modificare il loro modello durante l’inferenza per adottare uno stile formale nelle comunicazioni legali. Oppure il personale del marketing può adottare uno stile più conversazionale in base al pubblico.

Game On con SteerLM

Per mostrare il potenziale di SteerLM, NVIDIA lo ha dimostrato su uno dei suoi classici giochi – il gaming (guarda il video qui sotto).

Oggi, alcuni giochi includono molti personaggi non giocabili – personaggi che il giocatore non può controllare – i quali ripetono meccanicamente testi preregistrati, indipendentemente dall’utente o dalla situazione.

SteerLM rende questi personaggi più vivi, rispondendo con più personalità ed emozione alle richieste dei giocatori. È uno strumento che i game developer possono utilizzare per offrire esperienze uniche a ogni giocatore.

La Genesi di SteerLM

Il concetto dietro il nuovo metodo è arrivato inaspettatamente.

“Mi sono svegliato presto una mattina con questa idea, quindi mi sono alzato e l’ho scritta”, ha ricordato Yi Dong, uno scienziato di ricerca applicata presso NVIDIA, che ha iniziato il lavoro su SteerLM.

Mentre costruiva un prototipo, ha realizzato che una tecnica popolare di condizionamento del modello poteva far parte del metodo. Una volta che tutte le parti sono state messe insieme e l’esperimento ha funzionato, il team ha contribuito a definire il metodo in quattro semplici passaggi.

È l’ultimo avanzamento nella personalizzazione dei modelli, un’area molto attiva nella ricerca sull’intelligenza artificiale.

“È un campo stimolante, una sorta di Santo Graal per rendere l’intelligenza artificiale più simile alla prospettiva umana, e amo una nuova sfida”, ha dichiarato il ricercatore, che ha conseguito un dottorato di ricerca in neuroscienze computazionali presso la Johns Hopkins University, per poi lavorare su algoritmi di apprendimento automatico nel settore finanziario prima di entrare a far parte di NVIDIA.

Prendi le redini

SteerLM è disponibile come software open-source per i programmatori da provare oggi. Possono anche ottenere dettagli su come sperimentare un modello Llama-2-13b personalizzato utilizzando il metodo SteerLM.

Per gli utenti che desiderano una piena sicurezza e supporto aziendale, SteerLM sarà integrato in NVIDIA NeMo, un ricco framework per la creazione, personalizzazione e distribuzione di grandi modelli AI generativi.

Il metodo SteerLM funziona su tutti i modelli supportati su NeMo, inclusi i popolari modelli LLM già pre-allenati dalla comunità, come Llama-2 e BLOOM.

Leggi un blog tecnico per saperne di più su SteerLM.

Vedi avviso riguardante le informazioni sul prodotto software.