Distribuzione di Dirichlet L’intuizione sottostante e l’implementazione in Python

Distribuzione di Dirichlet in Python

Tutto quello che devi sapere sulla distribuzione di Dirichlet

Fonte immagine: https://pixabay.com/vectors/cubes-dice-platonic-solids-numbers-160400/

La distribuzione di Dirichlet è una generalizzazione della distribuzione beta. Nella statistica bayesiana, viene comunemente utilizzata come prior coniugata per la distribuzione multinomiale, quindi può essere utilizzata per modellare l’incertezza di un vettore casuale di probabilità. Ha un’ampia gamma di applicazioni, tra cui l’analisi bayesiana, il text mining, la genetica statistica e l’inferenza non parametrica. Questo articolo fornisce un’introduzione intuitiva alla distribuzione di Dirichlet e mostra come è collegata alla distribuzione multinomiale. Inoltre, mostra come può essere modellata e visualizzata in Python.

Definizione

Supponiamo che le variabili casuali continue X₁, X₂, …Xₖ (k≥2) formino il vettore casuale X definito come:

Definiamo anche il vettore α come:

dove

Ora il vettore casuale X si dice avere una distribuzione di Dirichlet con parametro α se ha la seguente funzione di densità congiunta:

La funzione B(α) è chiamata funzione beta multivariata e è definita come

dove Г(x) è la funzione gamma. Se il vettore casuale X ha una distribuzione di Dirichlet con parametro α, viene indicato come X ~ Dir(α). La funzione beta multivariata è inclusa nella funzione di densità congiunta per normalizzarla. La funzione di densità congiunta dovrebbe integrare a 1 nel suo dominio:

Pertanto, abbiamo:

Basandoci sull’Equazione 1, i valori che le variabili casuali X₁, X₂, …Xₖ assumono devono soddisfare le seguenti condizioni affinché f(x)>0:

Queste condizioni definiscono il supporto della distribuzione di Dirichlet. Il supporto di X, e della sua distribuzione, è l’insieme di tutti i x (i valori che X può assumere) in cui f(x)>0. Se X ha k elementi, il supporto di X con una distribuzione di Dirichlet è un simplesso di dimensione k-1. Un simplesso è una varietà lineare limitata che si crea a causa dei vincoli dell’Equazione 3. Un simplesso è la generalizzazione del concetto di triangolo a dimensioni superiori. Pertanto, un k-1…