Pandas per l’Analisi dei Dati

Pandas per l'Analisi dei Dati' can be condensed to 'Pandas Data Analysis

Scopri come utilizzare pandas, il pacchetto Python per analizzare facilmente i tuoi dati

Foto di Sid Balachandran su Unsplash

Pandas, il pacchetto Python, fornisce strutture dati veloci, flessibili ed espressive progettate per semplificare il lavoro con i dati ed è uno strumento di analisi e manipolazione dei dati open-source. È fondamentale per effettuare analisi dei dati pratiche in Python.

Hai bisogno di una buona comprensione della natura dei tuoi dataset mentre lavori su di essi. Pandas è il miglior strumento per aiutarti a farlo. Quindi entriamoci dentro e impariamo le varie funzioni e caratteristiche fornite da pandas.

Prima di tutto, assicurati di avere pandas installato nel tuo sistema

Usando conda:

conda install pandas

Usando pip:

pip install pandas

Pandas fornisce due componenti principali:

  1. Serie
  2. DataFrames

1. Serie

Le Serie sono simili alle liste. Puoi pensarle come un array unidimensionale. Per impostazione predefinita, ogni elemento riceve un’etichetta di indice da 0 a (n-1), dove n è la dimensione della Serie. Creiamo una Serie con un elenco arbitrario di nomi.

>>> s = pd.Series((‘Jen’,’Neil’,’Jay’,’Dan’,’Kev’,’Mo’))>>> print(s)0     Jen 1    Neil 2     Jay 3     Dan 4     Kev 5      Mo dtype: object

Tutti i nomi sono indicizzati da numeri da 0 a n-1.

Per quanto riguarda la proprietà ‘dtype’, viene utilizzata per trovare il tipo di dati nel DataFrame. Restituisce una Serie con il tipo di dati di ogni colonna. Le colonne che consistono in tipi misti sono memorizzate con il tipo di oggetto.

Indicizzazione tramite interi

Successivamente, seleziona un elemento specifico dalla Serie. Puoi utilizzare l’indicizzazione tramite interi per farlo. Di seguito viene fornito un esempio dello stesso.

>>> print(s[1])Neil

Slicing

Per selezionare gli elementi da 3 a 5, possiamo utilizzare la tecnica di slicing che seleziona un intervallo di elementi dalla Serie.

>>> print(s[2:4])2    Jay 3    Dan dtype: object

Questo non include l’elemento all’indice 4. Restituirà solo gli elementi indicizzati a 2 e 3.