Analisi dei dati geospaziali con Python

Analisi geospaziale con Python

Un post pratico sull’analisi dei dati con codice Python.

Introduzione

La Data Science Geospaziale è una delle mie aree di interesse. Trovo affascinante come possiamo visualizzare i dati su una mappa e come spesso le relazioni tra i punti dati offrano rapidamente grandi intuizioni.

Credo che l’applicabilità di questa sottoarea della data science sia molto utile per qualsiasi attività commerciale, come supermercati, autonoleggi, logistica, immobili ecc. In questo post, esamineremo un dataset di AirBnb per la città di Asheville, NC, negli Stati Uniti.

Nota a margine: In quella città si trova una delle proprietà immobiliari più straordinarie d’America, e oserei dire del mondo. La proprietà appartiene alla famiglia Vanderbilt e, per lungo tempo, è stata la più grande proprietà privata del paese. Beh, vale sicuramente una visita, ma non è l’argomento principale qui.

Biltmore estate building in Ashville, NC. Foto di Stephanie Klepacki su Unsplash.

I dataset utilizzati in questo esercizio sono gli affitti di AirBnb per la città di Asheville. Possono essere scaricati direttamente dal loro sito web su http://insideairbnb.com/get-the-data, sotto la licenza Creative Commons Attribution 4.0 International.

Mettersi al lavoro.

Data Science Geospaziale

Le informazioni di questo post provengono principalmente dal libro citato di seguito (Applied Geospatial Data Science with Python, di David S. JORDAN). Quindi iniziamo importando alcuni moduli nella nostra sessione.

import pandas as pdimport geopandas as gpdimport matplotlib.pyplot as pltimport pysalimport splotimport reimport seaborn as snsimport folium# Per la mappa dei puntiimport geoplot.crs as gcrsimport geoplot as gplt

Ora notate che alcuni di essi potrebbero essere nuovi per voi, come lo sono anche per me. Se necessario, utilizzate pip install nome_modulo per installare qualsiasi pacchetto necessario. Nel mio caso, pysal e geoplot sono nuovi per me, quindi ho dovuto installarli.

Successivamente, leggeremo i dati da AirBnb.

# Apri il file degli annunci di affittelisting = pd.read_csv('/content/listings.csv',                       usecols=['id', 'property_type', 'neighbourhood_cleansed',                                'bedrooms', 'beds', 'bathrooms_text', 'price'...