Svelare i segreti della dimensione che cambia lentamente (SCD) una visione completa di 8 tipi

SCOPRIRE I SEGRETI DELLA DIMENSIONE CHE CAMBIA LENTAMENTE (SCD) - UNA VISIONE COMPLETA DI 8 TIPI

Guida approfondita su quando e come utilizzare 8 tipi di SCD

Foto di Donald Tran su Unsplash

Se stai progettando un data warehouse, è essenziale comprendere la metodologia della modellazione dimensionale. Uno dei concetti più importanti in questa metodologia è la Dimensione di Cambiamento Lento (SCD). Molte risorse online forniscono una panoramica generale della dimensione di cambiamento lento, ma spesso è necessario approfondire le spiegazioni riguardanti quale tipo di SCD utilizzare.

In questa storia verranno discussi gli otto tipi di SCD, ognuno con le sue caratteristiche e situazioni uniche. Alla fine, capirai chiaramente ogni tipo e sarai in grado di differenziarli quando crei il tuo prossimo SCD nella modellazione dimensionale.

Perché è necessario SCD nella modellazione dimensionale?

Tipicamente, OLTP memorizza solo i dati recenti. Quando viene eseguita un’istruzione di aggiornamento, i dati correnti vengono sostituiti e i dati precedenti vengono persi a meno che il sistema non sia specificamente progettato per conservare i dati storici, il che potrebbe causare una latenza aggiuntiva.

D’altra parte, un sistema OLAP, che spesso utilizza la modellazione dimensionale, sarebbe interessato alla tendenza e ricaverebbe informazioni per l’attività, e di solito è preferibile conservare i record storici.

Il obiettivo principale per SCD è tracciare la storia del cambiamento.

Nella modellazione dimensionale, lo schema più comunemente utilizzato è lo schema a stella. Questo schema ruota attorno a una grande tabella dei fatti che contiene vari campi di misurazione per la tua attività. Le tabelle delle dimensioni che circondano la tabella dei fatti contengono campi che consentono la manipolazione e l’analisi dei dati all’interno della tabella dei fatti. Le tabelle dei fatti di solito hanno molte righe e si aspettano di essere aggiornate rapidamente. D’altra parte, le dimensioni cambiano lentamente o mai.

L’importanza della chiave surrogata

La connessione tra i fatti e le dimensioni sono le chiavi in ogni tabella. Di solito sono chiavi surrogate anziché gli ID utilizzati nel sistema OLTP. La chiave surrogata viene di solito generata durante l’elaborazione dei dati del data warehouse e decisa dopo aver consultato gli ID dell’OLTP. Questo è fondamentale per alcuni tipi di SCD per evitare la perdita della chiave primaria…