Distribuzione log-normale semplicemente spiegata
Spiegazione semplice della distribuzione log-normale
Una leggera modifica della famosa distribuzione normale
Background
La distribuzione normale è un termine molto conosciuto, soprattutto nei campi della scienza dei dati e dell’apprendimento automatico. Tuttavia, hai mai sentito parlare della distribuzione log-normale? Ha applicazioni in una vasta gamma di settori, dalla biologia alla finanza, pertanto è un concetto molto utile per i data scientist da comprendere. In questo articolo, approfondiremo la teoria e le applicazioni di questa distribuzione.
Definizione
La distribuzione log-normale è relativamente facile da capire. Una variabile casuale X fa parte della distribuzione log-normale se il suo logaritmo è distribuito normalmente:
Il grafico sottostante visualizza questo concetto:
Notate come l’applicazione del logaritmo alle variabili casuali nel grafico di sinistra porta a una distribuzione che è distribuita normalmente, ovvero il grafico di destra.
- Ricercatori del CMU e dell’Università di Tsinghua propongono Prompt2Model un metodo a scopo generale che genera modelli di intelligenza artificiale utilizzabili da istruzioni in linguaggio naturale.
- Una panoramica dell’algebra lineare le basi
- 🦜🔗Costruisci backend di apprendimento automatico robusti con Pydantic e Langchain
Teoria
Se Z è una variabile normale standard, ha una media, µ, di 0 e una deviazione standard, σ, di 1. La distribuzione log-normale per una variabile casuale X è:
Quindi, prendendo il logaritmo di entrambi i membri dell’equazione:
Il termine a destra dell’equazione è una distribuzione normale poiché Z è distribuito normalmente. Pertanto, vediamo che il logaritmo di X è una distribuzione normale.
La funzione di densità di probabilità (PDF) per la distribuzione log-normale è molto simile alla distribuzione normale, ma la variabile casuale x ha una trasformazione logaritmica applicata ad essa:
Vedi qui per una derivazione della PDF.
Applicazioni
La distribuzione log-normale viene spesso utilizzata per modellare i tassi di crescita, che sono indipendenti dalla dimensione. Questo è comune nei fenomeni naturali, ad esempio:
- Misurare le dimensioni degli organismi viventi
- Il volume delle precipitazioni
- Quantità di petrolio in una riserva petrolifera