Utilizzeresti ANOVA per la selezione delle caratteristiche?

Utilizzeresti l'Analisi della Varianza (ANOVA) per selezionare le caratteristiche?

Conoscere tutto di ANOVA con un interessante dataset.

Foto di Elimende Inagella su Unsplash

Spesso dimentichiamo il passaggio più cruciale nello sviluppo di un modello di Machine Learning — Selezione delle Caratteristiche. Non selezionare le giuste caratteristiche correlate alla variabile target può impedire al tuo modello di raggiungere le prestazioni desiderate.

La Selezione delle Caratteristiche influisce sull’intero flusso di lavoro in due modi:-

  1. Rimuove le caratteristiche inutili e ridondanti
  2. Alta probabilità di miglioramento delle prestazioni nel caso peggiore, senza cambiamenti nella precisione.

Scegliere la tecnica giusta può aiutarti a convergere verso il giusto insieme di caratteristiche più velocemente. A volte, è necessario scoprirlo sperimentando iterativamente vari metodi.

I metodi di filtro si basano su formulazioni statistiche per il ranking delle caratteristiche, mentre i metodi wrapper utilizzano modelli per scegliere le caratteristiche appropriate. In questo articolo, ci concentreremo su ANOVA — un metodo di filtro utilizzato per selezionare le caratteristiche altamente correlate alla nostra variabile target

Voglio che ritraggiate molto da questo articolo, nei prossimi minuti affronteremo i seguenti argomenti:-

  1. Chiara comprensione di cos’è ANOVA.
  2. Come puoi utilizzare ANOVA per implementarlo su un dataset.
  3. Visualizzazioni potenti.

ANOVA

L’analisi della Varianza aka ANOVA è un approccio statistico che ci aiuta a comprendere l’impatto di una caratteristica categorica su una variabile target. È un’estensione del test T, in cui il test T è limitato a testare 2 gruppi, mentre ANOVA è per più di 2 gruppi presenti in una caratteristica.

Differenza tra ANOVA e Test-T

Ipotesi ANOVA (Primo Passo) :-

L’ipotesi è come una conclusione preliminare basata su prove limitate in mano in modo da avere un punto di partenza per ulteriori indagini. Di solito, vengono presentate due ipotesi:-