Pandas Lavora sui tuoi dtypes!

Pandas Lavora sui tuoi dtypes!

Avere i tipi dati corretti in pandas è un must per un’analisi dei dati pulita. Ecco come e perché.

Avere tipi dati appropriati per le Series e i DataFrame è molto importante per molte ragioni:

  • Gestione della memoria: utilizzare il tipo dati corretto per una particolare serie può ridurre drasticamente l’uso della memoria, e per estensione questo si applica anche ai dataframe
  • Interpretazione: chiunque altro (umano o computer) farà delle supposizioni sui tuoi dati in base al loro tipo dati: se una colonna piena di numeri interi è memorizzata come stringa, la tratteranno come stringhe, non come numeri interi
  • Obbliga ad avere dati puliti, come affrontare valori mancanti o valori errati. Ciò faciliterà molto l’elaborazione dei dati in futuro

E ci sono probabilmente molte altre ragioni, puoi elencarne alcune? Se sì, scrivile in un commento.

In questo primo post della mia serie su pandas, voglio fare una panoramica dei tipi dati di base di pandas, o dtypes.

Foto di Chris Curry su Unsplash

<p+rivisiteremo 4="" 95%="" dtypes numerici, dtype booleani, dtype stringhe e dtype categorici.

Lo scopo finale di questo primo post è renderti più a tuo agio con i vari tipi di dati disponibili in pandas e quali sono le loro differenze.

Se sei interessato a pandas e alle serie temporali, assicurati di controllare i miei post sulla trasformata di Fourier per serie temporali:

  • Rivedi come la convoluzione si relaziona alla trasformata di Fourier e quanto sia veloce:

Trasformata di Fourier per le serie temporali: convoluzione veloce spiegata con numpy

Convoluzione 10000 volte più veloce utilizzando la trasformata di Fourier

towardsdatascience.com

  • <strong approfondisci="" comprensione="" convoluzione="" della="" di="" esempi="" immagini:

Trasformata di Fourier per le serie temporali: convoluzione immagini e SciPy

La convoluzione trasformata di Fourier si applica anche alle immagini

towardsdatascience.com

  • Capire come la trasformata di Fourier può essere visualizzata