Qual è la probabilità che due persone abbiano le stesse iniziali?

Qual è la probabilità che due persone abbiano le stesse iniziali?

Impara come utilizzare simulazioni, repliche e loop for in R per rispondere a molte domande di probabilità

Foto di Mario Gogh

Introduzione

La scorsa settimana, ho fatto parte di un team per lavorare su un progetto collaborativo. Il team era già formato da alcuni mesi, con diversi scienziati che lavoravano insieme al progetto. Per semplicità, erano soliti firmare documenti, menzionare colleghi nelle e-mail, ecc. con le iniziali (la prima lettera del nome seguita dalla prima lettera del cognome).

Un paio di giorni dopo essermi unito al progetto, quando dovevo firmare il mio primo documento con le mie iniziali, ci siamo resi conto che un’altra persona nel team aveva le stesse iniziali che avevo io.

Questo non era davvero un problema, poiché abbiamo deciso che io avrei scritto le mie iniziali al contrario, cioè “SA” invece di “AS”, e l’altra persona avrebbe continuato a firmare con “AS” come al solito.

Avremmo potuto fermarci qui. Tuttavia, l’idea di scrivere un post su questa aneddotica piuttosto banale mi è venuta quando il capo del team ha dichiarato, nel bel mezzo di una riunione: “È molto sfortunato che voi due abbiate le stesse iniziali! Quali sono le probabilità che ciò ci accada?!”.

Abbiamo speso un paio di minuti cercando di stimare questa probabilità, che alla fine si basavano principalmente sulle nostre intuizioni piuttosto che su un calcolo formale. Questo ha suscitato la mia curiosità.

Dato che il progetto su cui stiamo lavorando richiede l’utilizzo di simulazioni, ho deciso di concentrarmi sulla risposta a questa domanda tramite simulazioni in R. Detto questo, come per la maggior parte delle simulazioni, è buona prassi verificare questi risultati. Ciò si fa utilizzando la teoria delle probabilità. Questo confronto permetterà di valutare la veridicità dei risultati ottenuti attraverso le simulazioni.

Inoltre, ho pensato che sarebbe stato un bel modo per illustrare metodi non spesso presentati nei miei articoli: loop for, repliche e la scrittura di funzioni in R.

Quanto è probabile?

Prima di rispondere alla domanda sollevata dal capo del team, ci sono tre cose da notare:

  1. Sebbene il capo del team fosse curioso di conoscere la probabilità che esattamente due persone abbiano le…