Analisi esplorativa dei dati in Google Sheets

Analisi dati in Google Sheets

Confronto tra l’approccio di Google Sheets e Pandas

Immagine generata dall'autore

È sempre bello elaborare i dati utilizzando strumenti moderni come Pandas o Jupyter. Ma immaginiamo il caso in cui un collega o un amico chieda di effettuare un’analisi dei dati, ma non sia una persona tecnica, non utilizzi Python o Jupyter e non abbia un account in Tableau, Power BI o in qualsiasi altro servizio di fascia alta (ma, ahimè, non gratuito). In questo caso, elaborare i dati in Google Sheets può essere un’ottima soluzione a causa di diversi motivi:

  • Google è utilizzato in tutto il mondo; al momento della stesura di questo articolo, più di 1,8 miliardi di utenti hanno un account Google. Praticamente chiunque ha un account Google al giorno d’oggi e la condivisione di documenti sarà estremamente facile.
  • L’ecosistema di Google è sicuro e protetto. Supporta l’autenticazione a due fattori e moderni standard di sicurezza e persino i set di dati privati possono essere condivisi tra gruppi limitati di persone.
  • Ultimo ma non meno importante, la soluzione è gratuita e non richiede costi aggiuntivi. E come bonus, Google Sheets funziona nel browser, non richiede l’installazione di alcun software e può funzionare su qualsiasi piattaforma come Windows, Linux, OSX o persino su uno smartphone.

In questo articolo, effettuerò una semplice analisi esplorativa dei dati in Pandas, quindi ripeteremo questo processo in Google Sheets e vedremo come funziona.

Fonte dei dati

Per rendere le cose più divertenti, utilizzeremo un dataset reale. Creeremo uno strumento per calcolare l’energia generata dai pannelli solari. Per fare ciò, utilizzerò i dati del PVGIS (Sistema di informazione geografica fotovoltaica della Commissione europea), che possono essere accessibili gratuitamente tramite questo URL (Licenza CC BY 4.0):

Interfaccia PVGIS, Immagine dell'autore

Utilizzando questa pagina, possiamo scaricare i dati di irraggiamento solare, che ci consentono di calcolare la generazione di energia. Come si può vedere nella schermata, possiamo selezionare dati orari per diversi anni e diverse località. Dopo aver scaricato i dati, utilizziamoli in Pandas.

Analisi esplorativa dei dati in Pandas

Iniziamo con l’analisi esplorativa dei dati (EDA) in Pandas. È sempre più facile…