Analisi esplorativa dei dati in Google Sheets
Analisi dati in Google Sheets
Confronto tra l’approccio di Google Sheets e Pandas

È sempre bello elaborare i dati utilizzando strumenti moderni come Pandas o Jupyter. Ma immaginiamo il caso in cui un collega o un amico chieda di effettuare un’analisi dei dati, ma non sia una persona tecnica, non utilizzi Python o Jupyter e non abbia un account in Tableau, Power BI o in qualsiasi altro servizio di fascia alta (ma, ahimè, non gratuito). In questo caso, elaborare i dati in Google Sheets può essere un’ottima soluzione a causa di diversi motivi:
- Google è utilizzato in tutto il mondo; al momento della stesura di questo articolo, più di 1,8 miliardi di utenti hanno un account Google. Praticamente chiunque ha un account Google al giorno d’oggi e la condivisione di documenti sarà estremamente facile.
- L’ecosistema di Google è sicuro e protetto. Supporta l’autenticazione a due fattori e moderni standard di sicurezza e persino i set di dati privati possono essere condivisi tra gruppi limitati di persone.
- Ultimo ma non meno importante, la soluzione è gratuita e non richiede costi aggiuntivi. E come bonus, Google Sheets funziona nel browser, non richiede l’installazione di alcun software e può funzionare su qualsiasi piattaforma come Windows, Linux, OSX o persino su uno smartphone.
In questo articolo, effettuerò una semplice analisi esplorativa dei dati in Pandas, quindi ripeteremo questo processo in Google Sheets e vedremo come funziona.
Fonte dei dati
Per rendere le cose più divertenti, utilizzeremo un dataset reale. Creeremo uno strumento per calcolare l’energia generata dai pannelli solari. Per fare ciò, utilizzerò i dati del PVGIS (Sistema di informazione geografica fotovoltaica della Commissione europea), che possono essere accessibili gratuitamente tramite questo URL (Licenza CC BY 4.0):

Utilizzando questa pagina, possiamo scaricare i dati di irraggiamento solare, che ci consentono di calcolare la generazione di energia. Come si può vedere nella schermata, possiamo selezionare dati orari per diversi anni e diverse località. Dopo aver scaricato i dati, utilizziamoli in Pandas.
- DAE Talking Generazione di un volto parlante ad alta fedeltà guidata dalla voce con un Diffusion Autoencoder
- Tutorial Docker per Data Scientist
- Sblocca il successo di DataOps con DataOps.live – Presentato nella Guida di mercato di Gartner!
Analisi esplorativa dei dati in Pandas
Iniziamo con l’analisi esplorativa dei dati (EDA) in Pandas. È sempre più facile…