Costruzione di una matrice di correlazione con i valori p in Python

Creazione di una matrice di correlazione in Python con i valori p

Producendo un output di correlazione oltre i valori predefiniti in Python

Panoramica

Se sei un fan della matrice di correlazione, come lo sono io, questo articolo è per te. Questo articolo è particolarmente rivolto a coloro che utilizzano Python per generare, visualizzare e analizzare matrici di correlazione. Inoltre, questo articolo è per coloro che, come me, forse provengono da altri strumenti di analisi statistica e che sono stati viziati da output più estesi e informativi rispetto a quelli tipicamente trovati in Python.

Di seguito trovi come immagino di apparire quando sono arrabbiato e frustrato perché gli strumenti predefiniti in Python non mi trattano così bene come alcuni degli altri strumenti di analisi statistica che ho imparato all’inizio della mia carriera!

Foto di Julien L su Unsplash

Ad esempio, ho già scritto in precedenza sull’output mancante a cui gli utenti di Stata sono abituati durante la fusione di file di dati. Se hai trovato questo articolo e non sei sicuro al 100% di cosa sia esattamente una matrice di correlazione, ti dirò cosa è.

Matrici di Correlazione nella Pratica

Una matrice di correlazione è una tabella che mostra i coefficienti di correlazione tra le variabili. Ogni cella nella tabella mostra la correlazione tra due variabili, mentre la diagonale rappresenta la correlazione di una variabile con se stessa, che è sempre 1. I valori nella matrice variano tra -1 e 1. Una correlazione di 1 indica una perfetta relazione positiva, una correlazione di -1 indica una perfetta relazione negativa e una correlazione di 0 indica nessuna relazione tra le due variabili. Le matrici di correlazione sono ampiamente utilizzate nelle analisi statistiche per valutare le relazioni lineari tra le variabili e per determinare le variabili che sono più fortemente correlate tra loro.

Ecco come appare spesso una matrice di correlazione.

Credito immagine: tabella dell'autore dalla pubblicazione dell'autore.

Interpretazione delle Matrici di Correlazione

A scopo di discussione, ho evidenziato la quarta riga nella tabella precedente, con un riquadro rosso. All’interno di questo riquadro rosso, i risultati mostrano la relazione tra l’età e tre misure di risultato, tra cui…