Nuovi grafici SHAP Violino e Heatmap
Nuovi grafici SHAP Violino e Heatmap' -> 'Nuovi grafici SHAP
Cosa possono dirti i grafici nella versione 0.42.1 di SHAP sul tuo modello
Una delle principali preoccupazioni riguardo a SHAP riguarda il pacchetto stesso. Non era stato aggiornato per un po’ di tempo e i problemi su GitHub si stavano accumulando. Per sollievo di molti utenti, i contributori sono stati più attivi. Infatti, ci hanno fornito nuovi grafici – Violin e Heatmap. Faremo quanto segue:
- Fornire il codice per questi grafici
- Discutere quali nuove informazioni possiamo ottenere da essi
Puoi anche guardare questa introduzione sull’argomento:
Grafici SHAP esistenti
Continuiamo da un tutorial SHAP precedente. Puoi trovarlo nell’articolo qui sotto. Puoi anche trovare il progetto completo su GitHub. Per utilizzare i nuovi grafici dovrai aggiornare il pacchetto SHAP. Sto usando la versione 0.42.1.
Introduzione a SHAP con Python
Come creare e interpretare i grafici SHAP: waterfall, force, mean SHAP, beeswarm e dependence
towardsdatascience.com
- Sfruttare LLM con il Recupero delle Informazioni una semplice dimostrazione
- Come capire facilmente il codice Python degli altri?
- Come velocizzare l’inferenza fino a 9 volte su una CPU x86 con PyTorch
Per riassumere, abbiamo utilizzato SHAP per spiegare un modello costruito utilizzando il dataset dell’abalone. Questo dataset ha 4.177 istanze e puoi vedere esempi delle caratteristiche qui sotto. Utilizziamo queste 8 caratteristiche per prevedere y – il numero di anelli nel guscio dell’abalone.
Il tutorial prosegue calcolando i valori SHAP e visualizzando vari grafici SHAP. Comprendere alcuni di questi è utile per capire i nuovi grafici SHAP. Vedremo che forniscono informazioni simili.
Il primo è il grafico mean SHAP visto nella Figura 1. Per ogni caratteristica, questo fornisce il valore SHAP medio assoluto su tutte le istanze. Le caratteristiche che hanno contribuito in modo significativo alle previsioni avranno un alto valore SHAP medio. In altre parole, questo grafico ci dice quali caratteristiche sono più importanti in generale.