Distribuzione di Dirichlet L’intuizione sottostante e l’implementazione in Python
Distribuzione di Dirichlet in Python
Tutto quello che devi sapere sulla distribuzione di Dirichlet

La distribuzione di Dirichlet è una generalizzazione della distribuzione beta. Nella statistica bayesiana, viene comunemente utilizzata come prior coniugata per la distribuzione multinomiale, quindi può essere utilizzata per modellare l’incertezza di un vettore casuale di probabilità. Ha un’ampia gamma di applicazioni, tra cui l’analisi bayesiana, il text mining, la genetica statistica e l’inferenza non parametrica. Questo articolo fornisce un’introduzione intuitiva alla distribuzione di Dirichlet e mostra come è collegata alla distribuzione multinomiale. Inoltre, mostra come può essere modellata e visualizzata in Python.
Definizione
Supponiamo che le variabili casuali continue X₁, X₂, …Xₖ (k≥2) formino il vettore casuale X definito come:
Definiamo anche il vettore α come:
- Incontra il modello RT-2 di intelligenza artificiale di Google – Un robot che impara come un essere umano
- Sfruttare l’apprendimento automatico su Big Data con PySpark su AWS
- La rivoluzione dell’IA esplorazione delle applicazioni e dei casi d’uso nelle principali industrie
dove
Ora il vettore casuale X si dice avere una distribuzione di Dirichlet con parametro α se ha la seguente funzione di densità congiunta:
La funzione B(α) è chiamata funzione beta multivariata e è definita come
dove Г(x) è la funzione gamma. Se il vettore casuale X ha una distribuzione di Dirichlet con parametro α, viene indicato come X ~ Dir(α). La funzione beta multivariata è inclusa nella funzione di densità congiunta per normalizzarla. La funzione di densità congiunta dovrebbe integrare a 1 nel suo dominio:
Pertanto, abbiamo:
Basandoci sull’Equazione 1, i valori che le variabili casuali X₁, X₂, …Xₖ assumono devono soddisfare le seguenti condizioni affinché fₓ(x)>0:
Queste condizioni definiscono il supporto della distribuzione di Dirichlet. Il supporto di X, e della sua distribuzione, è l’insieme di tutti i x (i valori che X può assumere) in cui fₓ(x)>0. Se X ha k elementi, il supporto di X con una distribuzione di Dirichlet è un simplesso di dimensione k-1. Un simplesso è una varietà lineare limitata che si crea a causa dei vincoli dell’Equazione 3. Un simplesso è la generalizzazione del concetto di triangolo a dimensioni superiori. Pertanto, un k-1…