Falso Profeta un Modello di Regressione delle Serie Temporali Fatto in Casa

Falso Profeta Un Modello di Regressione delle Serie Temporali Artigianale

Prendere idee da Prophet di Meta per creare un potente modello di regressione temporale

Foto di Niklas Rhöse su Unsplash

In questo articolo di seguito, continuo la mia missione di costruire il mostro temporale di Frankenstein combinando idee dal popolare pacchetto Prophet¹ e il talk “Vincere con modelli semplici, anche lineari”².

Dopo averci ricordato di cosa stiamo parlando, toccheremo il modello di regressione – cos’è e perché è speciale.

Poi passeremo alla taratura degli iperparametri utilizzando la cross-validazione delle serie temporali per ottenere una parametrizzazione del modello “ottimale”.

Infine, convalideremo il modello utilizzando SHAP prima di approfittare della forma del modello per consentire indagini personalizzate e aggiustamenti manuali.

Ci sono molte cose da coprire – mettiamoci all’opera.

Nota a margine: abbiamo affrontato la preparazione dei dati di base e l’ingegnerizzazione delle caratteristiche in un articolo precedente, quindi passiamo direttamente alla modellazione. Recuperate cosa è stato fatto lì:

Falso Profeta: Ingegneria delle Caratteristiche per una Regressione Temporale Fatta in Casa (Parte 1 di 2)

Costruire su idee del pacchetto Prophet di Meta per creare caratteristiche potenti per modelli di apprendimento automatico a serie temporale

towardsdatascience.com

L’obiettivo principale

Ricordiamoci cosa stiamo facendo.

L’obiettivo finale è semplice: generare la previsione più accurata degli eventi futuri in un determinato arco di tempo.

Siamo partiti da zero, con una serie temporale contenente solo una variabile di data e la quantità di interesse. Da questo, abbiamo derivato ulteriori caratteristiche per aiutarci a modellare accuratamente i risultati futuri; queste sono state fortemente “ispirate” dall’approccio di Prophet.

Questo ci porta a dove siamo adesso: pronti per alimentare i nostri dati ingegnerizzati in un modello leggero, addestrandolo per fare previsioni future. In seguito approfondiremo il funzionamento interno del modello.

Ricordiamoci di come sono fatti i dati prima di continuare.

Dati

Stiamo utilizzando dati reali dal Regno Unito – in questo caso, il set di dati sugli incidenti stradali STAT19 che…