Punteggio! Il team NVIDIA si aggiudica il trofeo nei sistemi di raccomandazione

NVIDIA vince il trofeo nei sistemi di raccomandazione

Un team di cinque esperti di machine learning di NVIDIA, sparsi su quattro continenti, ha vinto tutte e tre le sfide in una prestigiosa competizione per costruire sistemi di raccomandazione all’avanguardia.

I risultati riflettono l’abilità del gruppo nell’applicare la piattaforma AI di NVIDIA alle sfide reali di questi motori dell’economia digitale. I sistemi di raccomandazione forniscono trilioni di risultati di ricerca, annunci, prodotti, musica e notizie a miliardi di persone ogni giorno.

Oltre 450 team di data scientist hanno partecipato all’Amazon KDD Cup ’23. La sfida della durata di tre mesi ha avuto i suoi colpi di scena e un finale al cardiopalma.

Accelerando

Nelle prime 10 settimane della competizione, il team aveva un vantaggio confortante. Ma nella fase finale, gli organizzatori hanno cambiato i dataset di test e altre squadre si sono avvantaggiate.

Gli esperti di NVIDIA hanno accelerato, lavorando di notte e nei fine settimana per recuperare. Hanno lasciato una scia di messaggi su Slack a tutte le ore inviati dai membri del team che vivono in città da Berlino a Tokyo.

“Abbiamo lavorato senza sosta, è stato molto emozionante”, ha detto Chris Deotte, un membro del team a San Diego.

Un Prodotto con un Altro Nome

La terza delle tre sfide è stata la più difficile.

I partecipanti dovevano prevedere quali prodotti gli utenti avrebbero acquistato in base ai dati delle loro sessioni di navigazione. Ma i dati di addestramento non includevano i nomi dei marchi di molte scelte possibili.

“Sapevo fin dall’inizio che sarebbe stato un test molto, molto difficile”, ha detto Gilberto “Giba” Titericz.

KGMON al Salvataggio

Basato a Curitaba, in Brasile, Titericz era uno dei quattro membri del team classificati come grandmaster nelle competizioni di Kaggle, le Olimpiadi online della scienza dei dati. Fanno parte di un team di ninja di machine learning che hanno vinto dozzine di competizioni. Il fondatore e CEO di NVIDIA, Jensen Huang, li chiama KGMON (Kaggle Grandmasters di NVIDIA), un gioco di parole basato su Pokémon.

In decine di esperimenti, Titericz ha utilizzato grandi modelli linguistici per creare IA generative per prevedere i nomi dei prodotti, ma nessuno ha funzionato.

In un lampo creativo, il team ha scoperto una soluzione alternativa. Le previsioni utilizzando il loro nuovo modello ibrido di classificazione/ranking sono state perfette.

Fino all’Ultimo Secondo

Nelle ultime ore della competizione, il team si è affrettato a unire tutti i loro modelli per alcune ultime sottomissioni. Avevano eseguito esperimenti notturni su fino a 40 computer.

Kazuki Onodera, un KGMON a Tokyo, era nervoso. “Non sapevo davvero se i nostri punteggi effettivi sarebbero stati in linea con le nostre stime”, ha detto.

I quattro KGMON (in senso orario dall’alto a sinistra) Onodera, Titericz, Deotte e Puget.

Deotte, anche lui un KGMON, lo ricorda come “qualcosa come 100 modelli diversi che lavorano insieme per produrre un unico risultato… l’abbiamo inviato alla classifica e BAM!”

Il team è passato davanti al suo avversario più vicino nell’equivalente dell’IA di una foto finish.

La Potenza del Transfer Learning

In un’altra sfida, il team doveva applicare le lezioni apprese da ampi dataset in inglese, tedesco e giapponese a dataset scarsi di un decimo delle dimensioni in francese, italiano e spagnolo. È il tipo di sfida reale che molte aziende affrontano mentre espandono la loro presenza digitale in tutto il mondo.

Jean-Francois Puget, tre volte grandmaster di Kaggle con sede fuori Parigi, conosceva un approccio efficace al transfer learning. Ha utilizzato un modello multilingue preaddestrato per codificare i nomi dei prodotti, per poi affinarne le codifiche.

“L’utilizzo del transfer learning ha migliorato enormemente i punteggi della classifica”, ha detto.

Mescolando Abilità e Software Intelligente

Gli sforzi dei KGMON mostrano che il campo noto come recsys è a volte più arte che scienza, una pratica che combina intuizione e iterazione.

È un’esperienza che viene codificata in prodotti software come NVIDIA Merlin, un framework che aiuta gli utenti a costruire rapidamente i propri sistemi di raccomandazione.

Il framework Merlin fornisce una soluzione completa per la costruzione di sistemi di raccomandazione.

Benedikt Schifferer, un membro del team con sede a Berlino che aiuta a progettare Merlin, ha utilizzato il software per addestrare modelli di trasformatori che hanno sbaragliato la competizione nella sfida classica dei recsys.

“Merlin fornisce ottimi risultati fin da subito e il design flessibile mi permette di personalizzare i modelli per la sfida specifica”, ha detto.

Cavalcando i RAPIDS

Come i suoi compagni di squadra, ha utilizzato anche i RAPIDS, un insieme di librerie open-source per accelerare la scienza dei dati sulle GPU.

Ad esempio, Deotte ha acceduto al codice da NGC, il centro di accelerazione software di NVIDIA. Chiamato DASK XGBoost, il codice ha aiutato a distribuire un compito grande e complesso su otto GPU e sulla loro memoria.

Per la sua parte, Titericz ha utilizzato una libreria RAPIDS chiamata cuML per cercare attraverso milioni di confronti di prodotti in pochi secondi.

Il team si è concentrato su raccomandatori basati su sessioni che non richiedono dati da visite multiple degli utenti. È una pratica consigliata in questi giorni in cui molti utenti vogliono proteggere la propria privacy.

Per saperne di più:

  • Vedi una sessione GTC sulla costruzione di raccomandatori basati su sessioni con Merlin.
  • Fai un corso recsys dall’Istituto di Deep Learning di NVIDIA.
  • Scopri il flusso di lavoro per la previsione del prossimo elemento che fa parte di NVIDIA AI Enterprise, una suite software completa con la sicurezza e il supporto necessari per le aziende.
  • E guarda il video qui sotto.