Nuovi grafici SHAP Violino e Heatmap

Nuovi grafici SHAP Violino e Heatmap' -> 'Nuovi grafici SHAP

Cosa possono dirti i grafici nella versione 0.42.1 di SHAP sul tuo modello

(fonte: autore)

Una delle principali preoccupazioni riguardo a SHAP riguarda il pacchetto stesso. Non era stato aggiornato per un po’ di tempo e i problemi su GitHub si stavano accumulando. Per sollievo di molti utenti, i contributori sono stati più attivi. Infatti, ci hanno fornito nuovi grafici – Violin e Heatmap. Faremo quanto segue:

  • Fornire il codice per questi grafici
  • Discutere quali nuove informazioni possiamo ottenere da essi

Puoi anche guardare questa introduzione sull’argomento:

Grafici SHAP esistenti

Continuiamo da un tutorial SHAP precedente. Puoi trovarlo nell’articolo qui sotto. Puoi anche trovare il progetto completo su GitHub. Per utilizzare i nuovi grafici dovrai aggiornare il pacchetto SHAP. Sto usando la versione 0.42.1.

Introduzione a SHAP con Python

Come creare e interpretare i grafici SHAP: waterfall, force, mean SHAP, beeswarm e dependence

towardsdatascience.com

Per riassumere, abbiamo utilizzato SHAP per spiegare un modello costruito utilizzando il dataset dell’abalone. Questo dataset ha 4.177 istanze e puoi vedere esempi delle caratteristiche qui sotto. Utilizziamo queste 8 caratteristiche per prevedere y – il numero di anelli nel guscio dell’abalone.

Il tutorial prosegue calcolando i valori SHAP e visualizzando vari grafici SHAP. Comprendere alcuni di questi è utile per capire i nuovi grafici SHAP. Vedremo che forniscono informazioni simili.

Il primo è il grafico mean SHAP visto nella Figura 1. Per ogni caratteristica, questo fornisce il valore SHAP medio assoluto su tutte le istanze. Le caratteristiche che hanno contribuito in modo significativo alle previsioni avranno un alto valore SHAP medio. In altre parole, questo grafico ci dice quali caratteristiche sono più importanti in generale.