Smystifyingi la dipendenza e perché è importante nell’inferenza causale e nella validazione causale

Svelando la dipendenza e la sua importanza nell'inferenza causale e nella validazione causale

Una guida passo-passo per capire il concetto di dipendenza e come applicarlo per validare grafi aciclici direzionati utilizzando Python

Foto di Ana Municio su Unsplash

Introduzione

La Causal Inference è un’area emergente della scienza dei dati che si occupa di determinare la relazione causa-effetto tra eventi e risultati, e ha il potenziale per aggiungere significativamente al valore che l’apprendimento automatico può generare per le organizzazioni.

Ad esempio, un algoritmo tradizionale di apprendimento automatico può predire quali clienti di prestiti sono più propensi a fare default, consentendo così un intervento tempestivo con i clienti. Tuttavia, sebbene questo algoritmo sia utile per ridurre i default dei prestiti, non avrà alcun concetto del perché si siano verificati e, se si conoscessero i motivi dei default, si potrebbe affrontare la causa sottostante. In questo mondo, l’intervento tempestivo potrebbe non essere più necessario perché i fattori che portano al default sono stati definitivamente risolti.

Questo è il potenziale della Causal Inference e il motivo per cui può generare un impatto significativo e risultati per le organizzazioni che sanno sfruttare questo potenziale.

Esistono diverse approcci, ma l’approccio più comune consiste nel completare i dati con un “Grafo Aciclico Direzionato” che racchiude e visualizza le relazioni causali nei dati, per poi utilizzare tecniche di inferenza causale per formulare domande di tipo “what-if”.

Il Problema

Un Grafo Aciclico Direzionato (DAG) che racchiude le relazioni causali nei dati viene di solito costruito manualmente (o semi-manualmente) da scienziati dei dati ed esperti di dominio che lavorano insieme. Pertanto, il DAG potrebbe essere errato, il che invaliderebbe qualsiasi calcolo causale portando a conclusioni errate e decisioni potenzialmente incorrette.

L’Opportunità

Esistono diverse tecniche per la “Validazione Causale” (il processo di convalida del DAG rispetto ai dati) e se queste tecniche funzionano, possono ridurre al minimo o eliminare gli errori nel DAG, garantendo così che…