Ricercatori di Apple propongono un nuovo modello di decomposizione dei tensori per il filtraggio collaborativo con feedback implicito

Apple researchers propose a new tensor decomposition model for collaborative filtering with implicit feedback.

La capacità di inferire le preferenze dell’utente dai comportamenti passati è cruciale per suggerimenti personalizzati efficaci. Il fatto che molti prodotti non abbiano valutazioni a stelle rende questa attività esponenzialmente più difficile. Le azioni passate vengono generalmente interpretate in forma binaria per indicare se un utente ha o meno interagito con un determinato oggetto in passato. Sulla base di questi dati binari, sono necessarie ulteriori ipotesi per dedurre le preferenze degli utenti da tali input occulti.

È ragionevole presumere che gli utenti apprezzino i contenuti con cui hanno interagito e ignorino i contenuti che non hanno attirato la loro attenzione. Tuttavia, questa presunzione raramente è corretta nell’uso effettivo. È possibile che un consumatore non interagisca con un prodotto perché non ne è nemmeno consapevole. Pertanto, è più plausibile presumere che gli utenti semplicemente ignorino o non si interessino agli aspetti con cui non possono interagire.

Gli studi hanno ipotizzato che ci sia una tendenza a preferire i prodotti con cui si è già familiari rispetto a quelli con cui non si è. Questa idea ha dato origine a Bayesian Personalized Ranking (BPR), una tecnica per fornire raccomandazioni personalizzate. In BPR, i dati vengono trasformati in un tensore binario tridimensionale chiamato D, in cui la prima dimensione rappresenta gli utenti.

Uno studio recente di Apple ha creato una variante del popolare modello di valutazione di base dei prodotti (BPR) che non si basa sulla transitività. Per la generalizzazione, propongono una decomposizione alternativa del tensore. Introducono Sliced Anti-symmetric Decomposition (SAD), un nuovo modello basato su feedback impliciti per il filtraggio collaborativo. Utilizzando una prospettiva tridimensionale inedita delle interazioni utente-oggetto, SAD aggiunge un altro vettore latente ad ogni oggetto, a differenza dei metodi convenzionali che stimano una rappresentazione latente degli utenti (vettori utente) e degli oggetti (vettori oggetto). Per produrre interazioni tra oggetti durante la valutazione delle preferenze relative, questo nuovo vettore generalizza le preferenze derivate dai prodotti scalari regolari a prodotti interni generici. Quando il vettore si riduce a 1, SAD diventa un modello di filtraggio collaborativo all’avanguardia (SOTA); in questa ricerca, consentiamo che il suo valore sia determinato dai dati. La decisione di consentire ai valori del nuovo vettore oggetto di superare 1 ha conseguenze di vasta portata. L’esistenza di cicli nei confronti a coppie viene interpretata come prova che i modelli mentali degli utenti non siano lineari.

Il team presenta un metodo rapido di discesa coordinata di gruppo per l’estimazione dei parametri di SAD. La semplice discesa del gradiente stocastico (SGD) viene utilizzata per ottenere rapidamente stime accurate dei parametri. Utilizzando uno studio simulato, dimostrano prima l’efficacia di SGD e l’espressività di SAD. Successivamente, utilizzando il trio di risorse liberamente disponibili sopra menzionate, mettono SAD a confronto con sette modelli di raccomandazione SOTA alternativi. Questo lavoro mostra anche che integrando dati e relazioni tra entità precedentemente ignorati, il modello aggiornato fornisce risultati più affidabili e accurati.

In questo lavoro, i ricercatori si riferiscono ai filtraggi collaborativi come feedback impliciti. Tuttavia, le applicazioni di SAD non sono limitate ai tipi di dati sopra menzionati. Ad esempio, i dataset con valutazioni esplicite contengono ordini parziali che possono essere utilizzati immediatamente durante l’adattamento del modello, a differenza della pratica attuale di valutare la coerenza del modello post-hoc.