Panoramica esecutiva dei modelli di Random Forest

Un'affascinante panoramica dei modelli di Random Forest

Dal germoglio alla copertura: Crescita delle Random Forest nel Machine Learning

All’inizio di questo articolo c’è un promemoria che non è necessario essere informatici per fare data science. In realtà, non è necessario essere data scientist per fare data science. A seconda della natura del problema che si sta cercando di risolvere, potete essere molto efficaci utilizzando strumenti e principi radicati nella data science.

Questo presupposto è valido anche se il vostro livello di competenza in statistica, programmazione e data science è ancora in fase di sviluppo.

Image Credit: Illustrazione dell'autore creata su Canva.

Lasciatemi fare un po’ di spazio aggiuntivo per coloro che sono nuovi nel percorso di apprendimento. A quanto pare, ogni tanto i lettori dei miei articoli condivideranno con me idee di codifica che io stesso non ho ancora visto o usato. Se siete più avanti nel vostro percorso di apprendimento e vedete che faccio qualcosa di strano che non ha senso o se vedete un modo migliore, sentitevi liberi di commentare.

Mentre leggete, se vi sentite un po’ persi da un termine chiave, c’è un glossario alla fine di questo articolo.

Innanzitutto, questo articolo fornisce una panoramica delle random forests, di cosa possono fare e da dove provengono, prima di parlare anche di tre funzionalità chiave dell’approccio moderno alle random forests che le rendono molto efficaci in molti contesti. Inoltre, questo articolo illustra come le random forests effettuano predizioni prima di fornire una discussione sulle considerazioni coinvolte nella crescita di una random forest.

Panoramica Random Forest

Diamo uno sguardo al background nella filosofia delle random forests prima di addentrarci in questioni tecniche. Tecnicamente parlando, random forest è un metodo di insieme. Più spesso, questo metodo viene utilizzato per la classificazione. Parlerò brevemente di come è possibile utilizzare random forests o alberi decisionali per compiti di regressione.

Inoltre, le random forests sono una forma di machine learning supervisionato, il che significa che quando le utilizziamo, useremo dati di allenamento storici per insegnare al computer (o insegnare a un modello) a fare previsioni su nuovi dati in futuro.