3 utili consigli su Pandas per lavorare con dati di tipo data e ora

3 consigli su Pandas per dati data e ora

Impara rapidamente come trasformare i dati delle serie temporali e sfruttarli al massimo in Python Pandas

Foto di Jack Hunter su Unsplash

I dati di data e ora sono ovunque! Padroneggia le tecniche per manipolarli!

Indipendentemente dall’industria in cui stai lavorando, i dati delle serie temporali sono sempre presenti. E puoi esplorare le tendenze nascoste e i modelli in essi analizzandoli per ottenere informazioni preziose. Questo ti aiuterà a prendere decisioni basate sui dati e pianificare in base ai dati storici.

Nel mio articolo precedente, puoi esplorare 3 trucchi utili per lavorare con tali dati in Python. Tuttavia, quando lavori con dati di serie temporali in un DataFrame di pandas, è meglio utilizzare classi e funzioni di pandas.

Quando leggi i dati nel DataFrame di pandas, pandas li memorizza spesso come tipo di dato stringa o oggetto. E per analizzare tali dati in modo efficace, è necessario convertirli nel tipo di dato DateTime.

In questo articolo, esplorerai 3 consigli testati e risparmiati per lavorare con dati di serie temporali in pandas. Esplorerai una serie di classi e funzioni in pandas per lavorare in modo efficace con date e orari.

Prepariamo il terreno – leggi i dati di vendita finti in un DataFrame df!

df = pd.read_csv("Dummy_dates_sales.csv")df.head()

Si tratta di un semplice set di dati di dimensioni 100 x 2 che contiene la colonna di data-ora Dates e la colonna intera Sales. Ho creato questo set di dati utilizzando il pacchetto Python Faker e puoi ottenerlo gratuitamente dal mio repository GitHub!

Prima di elaborare i dati di serie temporali, è importante verificare se pandas ha riconosciuto correttamente il loro tipo di dati. In caso contrario, è necessario convertirlo nel tipo di dati datetime.

Verifichiamolo –

df.info()
Tipo di dati delle colonne del DataFrame in pandas | Immagine di Author

Qui, pandas legge questi valori nella colonna Dates come stringhe. Pertanto, per ottenere il massimo valore da questi dati di data e ora, è necessario convertirli nel tipo di dati data e ora.

Converti la colonna di Pandas in Datetime