Esplora intuitivamente le metriche R2 e R2 corretto

Esplora metriche R2 e R2 corretto intuitivamente

In questo articolo, imparerai in modo intuitivo come funzionano le metriche R2 e Adjusted-R2.

Foto di Siora Photography su Unsplash

R2 è ampiamente utilizzato come metrica di valutazione per compiti di machine learning di regressione. Essa determina quanto della varianza della caratteristica target (caratteristica dipendente) può essere spiegata dal modello di machine learning (il modello è essenzialmente una funzione delle caratteristiche indipendenti).

Ora, potresti chiederti a cosa servirà conoscere la varianza della caratteristica target. Per rispondere a questa domanda, dobbiamo capire come la varianza possa essere intesa come strumento di misurazione delle informazioni. Fondamentalmente, maggiore è la varianza di una cosa, maggiori sono le informazioni che abbiamo su quella cosa.

Per capire questo concetto, prendiamo un esempio. Supponiamo che stiamo giocando a un gioco in cui tre dei nostri amici hanno coperto il viso e ora dobbiamo riconoscere chi è chi in base alla loro altezza. Se la differenza di altezza (~ varianza delle altezze) tra i tre amici è piuttosto alta, allora sarà estremamente facile riconoscere tutti gli amici. D’altra parte, se gli amici hanno altezze confrontabili, sarà piuttosto difficile riconoscerli solo in base all’altezza. In questo caso, dovremo guardare altri criteri come il peso.

Quindi, quando c’era una maggiore differenza di altezza, potevamo facilmente riconoscere tre amici. Questo esempio spiega come la varianza possa essere concepita come una misura delle informazioni.

Metrica R2

R2 confronta il nostro modello addestrato con il modello che restituisce sempre la media dei punti dati (quanto è buona una linea gialla rispetto a una linea verde).

Per calcolare la metrica R2, abbiamo bisogno di conoscere due valori:

  1. Varianza dei valori della caratteristica target intorno alla media dei dati (varianza media), ovvero la varianza dei punti grigi rispetto alla linea verde.
  2. Varianza della caratteristica target intorno alla linea di miglior adattamento (varianza del modello), ovvero la varianza dei punti grigi rispetto alla linea gialla.

La varianza media può essere interpretata anche come la varianza della caratteristica target spiegata dal modello che restituisce la media dei dati per ogni input. Questo può essere spiegato dalla linea orizzontale che taglia l’asse y alla media di tutte le coordinate y dei nostri punti dati (linea verde nella figura).

La varianza del modello può essere concepita come la varianza della caratteristica target spiegata dal nostro modello addestrato per i dati forniti (linea gialla nella figura).

Come interpretare R2

Il valore di R2 indica la proporzione di varianza della caratteristica target che può essere spiegata dal tuo modello. Maggiore è la proporzione di varianza spiegata, migliore è il tuo modello. Quindi, un valore di R2 vicino a 1 corrisponde a un buon modello, mentre un valore vicino a si riferisce a un modello scarso.

Supponiamo che il valore di R2 del nostro modello sia 0,85. Questa affermazione significa che il nostro modello addestrato spiega l’85% della varianza nella caratteristica target.

Valori possibili di R2

  1. R2 esiste tra 0 e 1 (entrambi inclusi). A volte può essere anche negativo. Questo caso negativo può verificarsi quando addestriamo un modello sui dati di addestramento e poi testiamo il modello addestrato sui nuovi dati. Questo perché non sarà sempre il caso in cui la varianza delle previsioni sui nuovi dati sia inferiore alla varianza del modello medio. Otterremo sempre un valore di R2 positivo se addestriamo sul dati di addestramento e testiamo nuovamente il nostro modello sui dati di addestramento.
  2. R2 = 0 => Il modello addestrato è equivalente al modello medio (modello con prestazioni molto scarse)
  3. Il valore massimo di R2 è 1.

Problema con R2

R2 aumenta ogni volta che aggiungiamo una nuova caratteristica indipendente ai dati di addestramento. Ciò accade anche quando aggiungiamo una caratteristica inutile o casuale ai dati di addestramento. Questo perché è molto facile trovare una piccola correlazione anche nei dati casuali. Ma questa piccola correlazione potrebbe portare al sovradattamento del nostro modello. Quindi, abbiamo bisogno di una misura delle prestazioni che non aumenti su una così piccola correlazione. Questo problema viene risolto utilizzando un’altra misura delle prestazioni nota come R2 corretto.

Misura R2 corretta

L’idea di base di R2 corretto è penalizzare il punteggio man mano che aggiungiamo nuove caratteristiche al modello.

Il denominatore (n-m-1) diminuisce man mano che aumentiamo il valore di m. Quindi, se non troviamo un aumento significativo in R2, il valore dell’intera espressione non aumenterà o potrebbe addirittura diminuire.

In breve,

La leggera crescita del valore di R2 (a causa dell’aggiunta di una caratteristica non importante) => R2 corretto rimane quasi lo stesso o potrebbe addirittura diminuire

La crescita significativa del valore di R2 (a causa dell’aggiunta di una caratteristica importante) => R2 corretto aumenta significativamente

Outro

Spero che ti sia piaciuto questo articolo. Seguimi su VoAGI per leggere altri articoli simili.

Connettiti con me su LinkedIn

Scopri di più su di me su Website

Scrivimi all’indirizzo [email protected]

Riferimenti:

Il libro intitolato “Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow”

Spiegazione del R-quadrato negativo. Perché e quando il R-quadrato, il… | di Tan Nian Wei | Towards Data Science

Analisi delle componenti principali (PCA) spiegata in modo visuale senza matematica | di Casey Cheng | Towards Data Science

(1882) Metriche di regressione | MSE, MAE & RMSE | Punteggio R2 e punteggio R2 corretto — YouTube

(1882) R-quadrato, chiaramente spiegato!!! — YouTube