Riorganizzazione delle conferenze di football universitario – Analisi esplorativa dei dati in Python

Riorganizzazione conferenze football universitario - Analisi dati Python

È il mio periodo preferito dell’anno: l’autunno, il che significa che è tempo di football universitario. Ho sempre amato lo sport universitario. Crescendo, ho vissuto in una famiglia appassionata di Big Ten/SEC e in una città della Big East (ora ACC), il che significava che lo schermo televisivo era pieno di sport universitari dal primo calcio d’inizio ad agosto all’ultimo canestro vincente ad aprile. Di recente, l’analisi dei dati ha preso il sopravvento in entrambi gli sport, ma dato che è la stagione del football, cominciamo da lì.

Foto di David Ireland su Unsplash

Gli ultimi due periodi di sosta nello sport universitario sono stati animati da notizie sul NIL, sul portale dei trasferimenti e sulla riorganizzazione delle conferenze. Penso che il sentimento tra la maggior parte dei tifosi sia catturato dallo spot “Chaos Comes to Fansville” del Dr. Pepper. Ho notato che ogni conversazione sulla riorganizzazione delle conferenze, in particolare, era piena di speculazioni e alimentata da sensazioni viscerali. C’era, tuttavia, una fede comune che un grande e potente Oz del football universitario stesse elaborando i numeri per decidere quale squadra valesse la pena aggiungere a quale conferenza. Non ho ancora avuto l’opportunità di incontrare l’uomo dietro la tenda, quindi fino ad allora vorrei fare un tentativo di proporre una riorganizzazione delle conferenze basata sui dati.

Questo è un blog in quattro parti che spero possa essere un modo divertente per imparare alcuni nuovi strumenti di data science:

  1. Riorganizzazione delle conferenze di football universitario – Analisi esplorativa dei dati in Python
  2. Riorganizzazione delle conferenze di football universitario – Regressione
  3. Riorganizzazione delle conferenze di football universitario – Clustering
  4. Riorganizzazione delle conferenze di football universitario – node2vec

Precederò questo post dicendo che ci sono molti modi per eseguire un’analisi esplorativa dei dati, quindi qui coprirò solo alcuni metodi pertinenti alla riorganizzazione delle conferenze.

I Dati

Ho dedicato del tempo per costruire il mio dataset utilizzando fonti che ho raccolto da tutto il web. Questi dati includono informazioni di base su ogni programma FBS, un’approssimazione non canonica di tutte le rivalità del football universitario, dimensioni degli stadi, prestazioni storiche, frequenza delle apparizioni nelle prime 25 classifiche AP, se la scuola è un’istituzione AAU o R1 (storicamente importante per l’appartenenza alla Big Ten e alla Pac 12), il numero di scelte nel draft NFL, dati sui ricavi del programma da…