Come l’IA sta sconvolgendo la governance dei dati?

How is AI disrupting data governance?

La relazione simbiotica tra data governance e AI

L'AI sta trasformando il mondo della data governance - Immagine cortesia di CastorDoc

L’AI generativa ha già cominciato a scuotere il mondo della data governance e continuerà a farlo.

Sono passati solo 6 mesi dal rilascio di ChatGPT, ma sembra che abbiamo bisogno di una retrospettiva già ora. In questo articolo, esplorerò come l’AI generativa sta influenzando la data governance e dove ci porterà nel prossimo futuro. Sottolineo “prossimo” perché le cose evolvono rapidamente e possono prendere molte direzioni diverse. Questo articolo non riguarda la previsione dei prossimi 100 anni di data governance, ma piuttosto uno sguardo pratico ai cambiamenti che stanno avvenendo ora e quelli appena all’orizzonte.

Prima di immergerci, ricordiamoci di cosa si occupa la data governance.

Semplificando, la data governance è l’insieme di regole o processi che un’organizzazione segue per garantire che i dati siano affidabili. Comprende 5 aree chiave:

  • Metadati e documentazione
  • Ricerca e scoperta
  • Politiche e standard
  • Privacy e sicurezza dei dati
  • Qualità dei dati

In questo articolo, esamineremo come ognuna di queste aree è destinata a evolversi una volta che incorporiamo l’AI generativa.

Facciamolo!

Le cinque colonne della data governance - Immagine cortesia di CastorDoc

1. Metadati e documentazione

I metadati e la documentazione sono probabilmente la parte più importante della data governance e le altre parti si basano pesantemente su questa che viene fatta correttamente. L’AI ha già iniziato, e continuerà a cambiare il modo in cui creiamo contesto per i dati. Ma non voglio farvi sperare troppo in alto. Abbiamo ancora bisogno degli esseri umani nel processo di documentazione.

Produrre contesto intorno ai dati o documentare i dati ha due parti. Il primo elemento, che costituisce circa il 70% del lavoro, riguarda la documentazione di informazioni generali, comuni a molte aziende. Un esempio molto semplice è la definizione di “email”, che è comune a tutte le aziende. La seconda parte riguarda la stesura della conoscenza specifica propria della vostra azienda.

Ecco la parte entusiasmante: l’AI può fare gran parte del lavoro pesante per il primo 70%. Questo perché il primo elemento coinvolge conoscenze generali e l’AI generativa è eccellente nel gestirle.

E per quanto riguarda la conoscenza peculiare alla vostra azienda? Ogni organizzazione è unica e questa unicità dà origine al vostro linguaggio aziendale specifico. Questo linguaggio riguarda le metriche, gli indicatori chiave di prestazione e le definizioni aziendali. E non è qualcosa che può essere importato dall’esterno. Nasce dalle persone che conoscono meglio l’azienda, ovvero i suoi dipendenti.

Nelle mie conversazioni con i leader dei dati, discuto spesso di come creare una comprensione condivisa di questi concetti aziendali. Molti leader condividono che per raggiungere questo allineamento, coinvolgono i team di dominio nella stessa stanza per parlare, dibattere e concordare le definizioni che meglio si adattano al loro modello aziendale.

Prendiamo, ad esempio, la definizione di “cliente”. Per un’azienda basata su abbonamenti, un cliente potrebbe essere qualcuno che è attualmente abbonato al loro servizio. Ma per un’azienda di vendita al dettaglio, un cliente potrebbe essere chiunque abbia effettuato un acquisto negli ultimi 12 mesi. Ogni azienda definisce “cliente” in modo che abbia più senso per loro, e questa comprensione di solito emerge dall’interno dell’organizzazione.

Per quanto riguarda una conoscenza così peculiare, l’AI, per quanto intelligente sia, non può ancora fare questa parte. Non può partecipare alle vostre riunioni, unirsi alla discussione o aiutare a far fiorire nuovi concetti. Per Andreessen Horowitz, questo potrebbe diventare possibile quando arriva la seconda ondata di AI. Per ora, siamo ancora alla prima ondata.

Vorrei anche affrontare una domanda posta da Benn Stancil. Benn chiede: se un bot può scrivere la documentazione dei dati su richiesta per noi, qual è il punto di scriverla?

C’è una certa verità in questo: se l’IA generativa può generare contenuti su richiesta, perché non generarli solo quando ne hai bisogno, anziché preoccuparti di documentare tutto? Purtroppo, non funziona così, per due ragioni.

Primo, come ho spiegato in precedenza, una parte della documentazione riguarda gli aspetti unici di un’azienda che l’IA non può ancora catturare. Questo richiede competenze umane. Non può essere generato al volo dall’IA.

Secondo, anche se l’IA è avanzata, non è infallibile. I dati che genera non sono sempre accurati. È necessario assicurarsi che un essere umano controlli e confermi tutti i contenuti prodotti dall’IA.

2. Ricerca e scoperta

L’IA generativa sta cambiando non solo il modo in cui creiamo documentazione, ma anche il modo in cui la consumiamo. Infatti, stiamo assistendo a un cambiamento di paradigma nei metodi di ricerca e scoperta. I metodi tradizionali, in cui gli analisti cercano nel catalogo dei dati informazioni rilevanti, stanno diventando rapidamente obsoleti.

Un vero game changer risiede nella capacità dell’IA di diventare un assistente personale dei dati per tutti all’interno dell’azienda. In alcuni cataloghi dei dati, è già possibile rivolgersi all’IA con le proprie domande specifiche sui dati. Puoi fare domande come: “È possibile eseguire l’azione X con i dati?”, “Perché non riesco a utilizzare i dati per raggiungere l’obiettivo Y?” o “Possediamo dati che illustrano Z?”. Se i tuoi dati sono arricchiti con il contesto giusto, l’IA ti aiuterà a diffondere questo contesto in tutta l’azienda.

Un altro sviluppo che ci aspettiamo è che l’IA trasformerà il catalogo dei dati da un’entità passiva a un aiutante attivo. Pensaci: se stai usando una formula in modo errato, l’assistente AI potrebbe avvisarti. Allo stesso modo, se stai per scrivere una query che esiste già, l’IA potrebbe farti sapere e guidarti verso il lavoro già esistente.

In passato, i cataloghi dei dati erano lì, in attesa che tu li setacciassi per trovare risposte. Ma con l’IA, i cataloghi potrebbero iniziare ad aiutarti attivamente, offrendo intuizioni e soluzioni prima ancora che tu te ne renda conto. Questo rappresenterebbe un cambio completo nel modo in cui ci impegniamo con i dati, e potrebbe accadere molto presto.

Tuttavia, c’è una condizione affinché l’assistente AI funzioni in modo efficace: il tuo catalogo dei dati deve essere mantenuto. Per garantire che l’assistente AI fornisca una guida affidabile agli stakeholder, la documentazione sottostante deve essere affidabile al 100%. Se il catalogo non viene mantenuto correttamente, o se le politiche non sono chiaramente definite, l’assistente AI diffonderà informazioni errate in tutta l’azienda. Questo sarebbe più dannoso che non avere informazioni, in quanto potrebbe portare a decisioni sbagliate basate sul contesto errato.

Probabilmente l’hai capito: l’IA e la governance dei dati sono interdipendenti. L’IA può migliorare la governance dei dati, ma a sua volta è necessaria una solida governance dei dati per alimentare le capacità dell’IA. Questo si traduce in un ciclo virtuoso in cui ogni componente potenzia l’altro. Ma devi tenere presente che nessun elemento può sostituire l’altro.

La relazione simbiotica tra Data Governance e AI - Immagine di CastorDoc

3. Politiche e standard dei dati

Un altro componente chiave della governance dei dati è la formulazione e l’attuazione delle regole di governance.

Questo di solito comporta la definizione della proprietà dei dati e dei domini all’interno dell’organizzazione. Al momento, l’IA non è in grado di svolgere compiti di definizione di queste politiche e standard. L’IA brilla nell’esecuzione di regole o nel segnalare infrazioni, ma è carente quando si tratta di creare le regole stesse.

Questo avviene per una semplice ragione. Definire la proprietà e i domini riguarda la politica umana. Ad esempio, la proprietà significa decidere chi all’interno dell’organizzazione ha l’autorità su specifici set di dati. Questo potrebbe includere il potere di prendere decisioni su come e quando utilizzare i dati, chi ha accesso ad essi e come vengono gestiti e protetti. Prendere queste decisioni spesso comporta la negoziazione tra individui, team o dipartimenti, ognuno con i propri interessi e prospettive. E la politica umana, per ovvie ragioni, non può essere sostituita dall’IA.

Pertanto, ci aspettiamo che gli esseri umani continueranno a svolgere un ruolo significativo in questo aspetto della governance in un prossimo futuro. L’IA generativa può svolgere un ruolo nella stesura di un quadro di proprietà o nella suggerimento di domini di dati. Tuttavia, mantenere gli esseri umani nel processo rimane fondamentale.

4. Privacy e Sicurezza dei Dati

Tuttavia, l’IA generativa sta per scuotere le cose nel dipartimento della privacy della governance. La gestione dei diritti di privacy è un aspetto tradizionalmente temuto della governance. A nessuno piace. Coinvolge la creazione manuale di un’architettura complessa di autorizzazioni per garantire la protezione dei dati sensibili.

La buona notizia è che l’IA può automatizzare gran parte di questo processo. Dati i parametri come il numero di utenti e i loro ruoli rispettivi, l’IA può creare regole per i diritti di accesso. L’aspetto architettonico dei diritti di accesso, essendo fondamentalmente basato sul codice, si accorda bene con le capacità dell’IA. Il sistema AI può elaborare questi parametri, generare codice pertinente e applicarlo per gestire l’accesso ai dati in modo efficiente.

Un’altra area in cui l’IA può avere un grande impatto è nella gestione delle Informazioni di Identificazione Personale (PII). Oggi, l’etichettatura PII viene solitamente fatta manualmente, rendendola un onere per la persona responsabile. Questo è qualcosa che l’IA può automatizzare completamente. Sfruttando le capacità di riconoscimento dei pattern dell’IA, l’etichettatura PII può essere condotta in modo più accurato rispetto a quando viene effettuata da un essere umano. In questo senso, l’utilizzo dell’IA potrebbe effettivamente migliorare il modo in cui gestiamo la protezione della privacy.

Ciò non implica che l’IA sostituirà completamente l’intervento umano. Nonostante le capacità dell’IA, abbiamo ancora bisogno di supervisione umana per gestire situazioni impreviste e prendere decisioni quando necessario.

5. Qualità dei Dati

Non dimentichiamo la qualità dei dati, che è un pilastro importante della governance. La qualità dei dati garantisce che le informazioni utilizzate da un’azienda siano accurate, coerenti e affidabili. Mantenere la qualità dei dati è sempre stato un impegno complesso, ma le cose stanno già cambiando con l’IA generativa.

Come ho già detto, l’IA è ottima nell’applicare regole e segnalare violazioni. Ciò rende facile per gli algoritmi identificare anomalie nei dati. Puoi trovare una descrizione dettagliata su come l’IA influisce su diversi aspetti della qualità dei dati in questo articolo.

L’IA può anche abbassare la barriera tecnica della qualità dei dati. Questo è qualcosa che SODA sta già mettendo in atto. Il loro nuovo strumento, SodaGPT, offre un approccio senza codice per esprimere controlli di qualità dei dati, consentendo agli utenti di eseguire controlli di qualità utilizzando solo il linguaggio naturale. Ciò permette al mantenimento della qualità dei dati di diventare molto più intuitivo e accessibile.

Conclusione

Abbiamo visto che l’IA può potenziare la Governance dei Dati in modo tale da innescare l’inizio di un cambiamento di paradigma. Molte modifiche sono già in corso, e sono qui per restare.

Tuttavia, l’IA può solo costruire su una base già solida. Perché l’IA cambi l’esperienza di ricerca e scoperta nella tua azienda, devi già mantenere la tua documentazione. L’IA è potente, ma non può miracolosamente riparare un sistema difettoso.

Il secondo punto da tenere presente è che anche se l’IA può essere utilizzata per generare la maggior parte del contesto attorno ai dati, non può sostituire completamente l’elemento umano. Abbiamo ancora bisogno di umani nel processo per la convalida e per documentare la conoscenza unica di ciascuna azienda. Quindi, la nostra previsione in una frase per il futuro della governance: potenziata dall’IA, ancorata al discernimento e alla cognizione umana.

Chi siamo

Presso CastorDoc, stiamo costruendo uno strumento di documentazione dei dati per la generazione di Notion, Figma, Slack.

Vuoi dargli un’occhiata? Contattaci e ti mostreremo una demo.‍