Iniziare con le query del database a grafo, con foglio di riferimento rapido!

Guida rapida per iniziare con le query del database a grafo!

I database di grafi stanno guadagnando sempre più slancio anno dopo anno. Non sostituiranno mai completamente i database relazionali, né ci stanno provando. Ma inizieranno a entrare negli spazi in cui i datalake e i data warehouse stanno lottando. Un database di grafi è più veloce e intuitivo per analizzare reti di eventi, risorse e persone:

  • Transazioni finanziarie che coinvolgono pattern complessi e frodi occasionali
  • Interazioni nel settore sanitario tra pazienti, personale medico, strutture ed attrezzature
  • Reti di catene di approvvigionamento tra clienti, fornitori, appaltatori e prodotti
  • Bill of materials di produzione con ricette per i materiali di input

Questi tipi di relazioni in rete sono difficili da modellare e visualizzare in un modello di dati relazionale o dimensionale. Il database di grafi fornisce una struttura per simulare le reti del mondo reale in ambito aziendale.

Quando inizi ad utilizzare i database di grafi e i linguaggi di interrogazione, è importante prepararsi ad un cambiamento del tuo modello mentale. Innanzitutto, non esiste ancora un linguaggio di interrogazione standard ampiamente accettato come SQL. Come puoi vedere nell’allegato, esiste un gruppo di linguaggi concorrenti e una commissione che lotta per ottenere un unico standard GQL accettato da tutti. Per i nostri scopi di oggi, utilizzeremo il linguaggio di interrogazione Cypher, sviluppato e promosso dal principale fornitore di database, Neo4j.

Nelle query di grafi perdiamo alcune sintassi di SQL e guadagniamo altre sintassi. SELECT è stato sostituito da MATCH. FROM e JOIN sono stati scartati. Ma i comandi WHERE e ORDER BY sono utilizzati allo stesso modo. Le funzioni di aggregazione come SUM e AVG sono tutte presenti, ma il comando GROUP BY è stato scartato. Ma soprattutto, guadagniamo la capacità di interrogare i pattern nel grafo utilizzando le relazioni tra i nodi. Nell’allegato “Cheat Sheet” troverai un elenco degli approcci di interrogazione più comuni.

Di seguito è riportato il modello di grafo che sarà utilizzato nel “Cheat Sheet” allegato:

Ho selezionato un grafo di affitto perché quasi tutti hanno affittato almeno una volta nella vita! Ovviamente, questo grafo potrebbe essere molto più complesso se aggiungessimo l’elenco completo delle proprietà per ogni nodo.

Il prossimo passo è fare pratica. Puoi scaricare un dataset di esempio da una fonte come Kaggle o da un fornitore, come JanusGraph o Neo4j.

Se hai un dataset presso il tuo datore di lavoro o progetti personali che coinvolgono relazioni di rete, prova un database di grafi. Scoprirai che i dati che si adattano in modo scomodo in un database relazionale troveranno la loro dimora ideale in un grafo!

Scarica subito il “Cheat Sheet”!

****[Stan Pugsley](https://www.linkedin.com/in/spugsley/)**** è un consulente freelance di ingegneria e analisi dei dati con sede a Salt Lake City, nell’Utah. È anche docente presso la scuola di business dell’Università di Utah Eccles School. Puoi contattare l’autore via email.