Geospatial Data Science Analisi del Modello di Punti

Analisi del Modello di Punti

Un tutorial rapido per eseguire un’analisi dei pattern di punti geospaziali in Python.

Foto di Bernard Hermant su Unsplash

Introduzione

La Data Science Geospaziale è una sottoarea dell’area dei dati che si occupa dell’analisi dei punti dati tenendo in considerazione dove nello spazio si è verificato l’evento.

Diciamo che siamo proprietari di una catena di negozi al dettaglio che vende smartphone. La nostra catena ha alcuni centri di distribuzione e stiamo per aprire un paio di nuovi negozi. Dove possiamo farlo?

Tale informazione potrebbe derivare da un’analisi geospaziale che ci mostrerebbe dove sono concentrate le vendite, se ci sono cluster in cui le vendite sono più alte o più basse e altre informazioni.

L’analisi dei pattern di punti entra in gioco quando vogliamo assicurarci di avere un dataset geograficamente clusterizzato. Proprio come gran parte del nostro lavoro come Data Scientist, l’analisi dei pattern di punti consiste nel creare un’ipotesi e rimuovere gran parte dell’incertezza per confermarla o meno utilizzando le statistiche applicate ai dati. In questo caso, non è diverso. Ci sono un paio di test statistici da fare, che verranno mostrati in questo post.

A proposito, ultimamente abbiamo studiato la Data Science Geospaziale qui nel mio blog. Se non conosci molto sull’argomento, ecco due buone letture prima di immergerti in questo post.

Analisi dei dati geospaziali con Python

Un post di analisi dei dati pratico con codice Python.

towardsdatascience.com

Analisi dei dati geospaziali con Python (Parte 2 – Test di ipotesi)

Apprendimento sul test di ipotesi geospaziale per le inserzioni Airbnb di Asheville.

towardsdatascience.com

Codifica

Pacchetti

Iniziamo con i pacchetti da utilizzare in questo esercizio. Se uno di essi non è installato nel tuo ambiente, non dimenticare di utilizzare pip install o conda install (per gli utenti di Anaconda) seguito dal nome del pacchetto.

import pandas as pdimport numpy as npimport geopandas as gpdimport seaborn as snsimport…