Riorganizzazione delle Conferenze del College Football – Clustering

Riorganizzazione delle Conferenze del College Football - Clustering' -> 'Riorganizzazione delle Conferenze - Clustering

Benvenuti alla parte 3 di questa serie sulla riallocazione delle conferenze! Questo è il post del blog in cui inizieremo ad utilizzare il dataset per prendere decisioni sulla riallocazione. C’è una lamentela comune secondo cui la riallocazione delle conferenze distrugge le rivalità tradizionali e l’aspetto regionale del football universitario. È vero che gli sport universitari tendono ad essere regionali. È persino nel nome delle conferenze stesse: Pacific 12, Atlantic Coast, Southeastern e Big East Conferences, solo per citarne alcune. Alcune diventano ancora più specifiche quando includiamo l’FCS: Ohio Valley Conference. Ovviamente, i tempi delle conferenze regionali nell’FBS sono ormai lontani. Negli ultimi giorni, sembra che il Pac 12 possa essere un retaggio del passato, così come.

Questa serie è organizzata in quattro parti (e la motivazione completa si trova nella parte 1):

  1. Riallocazione delle conferenze del football universitario – Analisi esplorativa dei dati in Python
  2. Riallocazione delle conferenze del football universitario – Regressione
  3. Riallocazione delle conferenze del football universitario – Clustering
  4. Riallocazione delle conferenze del football universitario – node2vec
Foto di Gene Gallin su Unsplash

Spero che ogni parte della serie vi fornisca una prospettiva fresca sul futuro del tanto amato gioco del football universitario. Per coloro che non hanno letto la parte 1 o 2, un breve riassunto è che ho creato il mio stesso dataset compilato da fonti su tutto il web. Questi dati includono informazioni di base su ogni programma FBS, un’approssimazione non canonica di tutte le rivalità nel football universitario, dimensioni degli stadi, prestazioni storiche, frequenza delle apparizioni nelle classifiche AP top 25, se la scuola è un’istituzione AAU o R1 (storica per l’appartenenza al Big Ten e Pac 12), il numero di scelte al draft della NFL, dati sulle entrate del programma dal 2017 al 2019 e una stima recente delle dimensioni delle basi di tifosi del football universitario. Nella parte 1 abbiamo scoperto che c’erano diverse caratteristiche che correlavano fortemente con le dimensioni delle basi di tifosi, quindi nella parte 2 abbiamo sviluppato un modello di regressione lineare e un modello di regressione casuale per prevedere le dimensioni delle basi di tifosi.

Clustering

La mia motivazione per questo post è la seguente: le conferenze attuali si basano su un nucleo tradizionale. Puoi pensarle come un nuovo disco rigido del computer. Organizzate in modo pulito in modo contiguo nelle conferenze regionali…