Crea bellissimi (e utili) grafici a spaghetti con Python

Crea grafici a spaghetti con Python

I grafici a linee sovrapposte sono molto popolari al momento!

Foto di Hunter Harritt su Unsplash

Ultimamente ci sono stati molti articoli sul cambiamento climatico, e molti di essi presentano caratteristici grafici a linee sovrapposte che riassumono dati su diverse decadi. Ecco un esempio tratto dal Climate Reanalyzer che mostra come le temperature del mare negli ultimi anno e mezzo siano state molto al di sopra della media [1]:

Temperature della superficie del mare globale (60S-60N) (1981–2023) [1]

Ecco un grafico simile dal sito del Dr. Zachary Labe che mostra l’estensione del ghiaccio marino antartico negli ultimi 40+ anni [2]:

Estensione del ghiaccio marino antartico (1978–2023) [2]

Questi grafici sono diventati una scelta popolare per le infografiche, come in questo articolo, ma questa popolarità è un po’ sorprendente [3]. A causa della difficoltà nel seguire le singole linee in questi display densi e intrecciati, sono generalmente evitati e criticati come “plot a spaghetti”.

Ma c’è un segreto nell’utilizzo di questi plot a spaghetti con successo. È necessario mettere in evidenza una o due linee rispetto a uno sfondo ridotto di tutte le altre linee. Questa strategia consente di inserire le linee selezionate in un contesto generale. Rappresentano risultati normali o sono eccezioni? I risultati sono davvero buoni o davvero cattivi? Sovrapponendoli a una tendenza di fondo, la storia si scrive da sola.

In questo progetto di Data Science di Successo Rapido, produrremo una copia del precedente grafico del ghiaccio marino antartico utilizzando la libreria di grafici Plotly Express. Con questo esempio di codice, dovresti essere in grado di generare grafici simili per i tuoi dataset.

National Snow and Ice Data Center

Per i dati utilizzeremo un completo dataset pubblico compilato dal National Snow and Ice Data Center, parte del Cooperative Institute for Research in Environmental Sciences (CIRES) presso l’Università del Colorado, Boulder [4]. Questo dataset utilizza immagini satellitari per tracciare e monitorare i cambiamenti nel ghiaccio marino polare, come ad esempio l'”alone” di ghiaccio intorno all’Antartide.