Coltivare una carriera nel campo dei dati nell’era dell’Intelligenza Artificiale Generativa

Crescere nel settore dei dati nell'era dell'Intelligenza Artificiale Generativa.

Sensibilizzare sull’apprendimento di tre concetti fondamentali dei dati

Foto di Brett Jordan su Unsplash

Come professionista dei dati, sono semplicemente stupito da tutti gli ultimi sviluppi nell’ambito dell’IA generativa.

Mentre alcuni lo definiscono hype e sono pronti a scartarlo rapidamente come un’altra tendenza tecnologica, altri sono convinti che sia un game-changer.

Indipendentemente da quale posizione sostenete, è difficile ignorare le possibilità di trasformazione che l’IA generativa può portare al futuro dell’istruzione e del lavoro.

Per sostenere questa affermazione, è sufficiente menzionare che l’Università di Harvard sta introducendo un chatbot di intelligenza artificiale nelle aule a partire da questo autunno (autunno 2023) per approssimare un rapporto insegnante-studente di uno a uno. Gli studenti utilizzeranno il chatbot sviluppato da Harvard per guidarli verso soluzioni anziché fornire loro risposte dirette.

Per me, questo è un chiaro indicatore che Harvard sta innescando una ondata di cambiamento su come le nuove generazioni impareranno e, di conseguenza, lavoreranno.

In altre parole, l’IA generativa non è solo una tendenza passeggera e dobbiamo iniziare a trovare un modo per adattare i nostri ambienti di lavoro ad essa.

Nonostante la mia visione entusiasta dell’IA generativa, non ho mai avuto una tale FOMO prima d’ora.

In altre parole, anche se ho navigato tra vari ruoli legati ai dati negli ultimi 12 anni e ho acquisito conoscenze sui concetti di apprendimento automatico, non riesco a stare al passo con i nuovi sviluppi nell’area dell’IA generativa.

La nuova terminologia, il concetto di ingegneria delle richieste, lo sviluppo di nuovi grandi modelli di linguaggio, numerose app e soluzioni costruite su di essi, nuovi corsi di formazione online e il volume stesso di post su questo argomento – tutto questo è semplicemente schiacciante.

Inoltre, non riesco a liberarmi di quella sensazione inquietante che alcune delle mie competenze sui dati sono ormai obsolete.

L’idea che i miei colleghi di lavoro possano sostituire le mie abilità acquisite duramente con poche digitazioni è spaventosa.

Tuttavia, riflettendoci meglio, devo ammettere che non mi dispiace nemmeno il fatto che alcune (ma solo alcune) delle mie competenze verranno sostituite. Eseguire query ad hoc diverse volte alla settimana per rispondere alle stesse domande aziendali ripetitive è qualcosa che non ho mai amato fare.

Tra le altre cose, sono consapevole che “io” trovarmi tra i dati archiviati nel data warehouse e la generazione di informazioni aziendali sta rallentando il processo decisionale.

L’altra cosa di cui sono consapevole è che questa transizione, ovvero la mia sostituzione, non avverrà da un giorno all’altro.

Prima di tutto, gli attuali ambienti di sviluppo devono essere adattati, ovvero devono essere più “user-friendly” per gli utenti aziendali e meno “developer-friendly” per i programmatori.

In secondo luogo, gli utenti aziendali dovranno acquisire una comprensione tecnica di ciò che si trova “dietro l’hub”. La libertà di generare informazioni analitiche dalle voci di testo naturali comporta gli stessi problemi.

Problemi come la lenta generazione di informazioni, la generazione errata di informazioni, l’arricchimento delle informazioni senza nuovi input (nuove fonti di dati) e il processo tecnico di controllo della qualità delle informazioni continueranno ad esistere.

E qualcuno dovrà ancora occuparsi e “risolvere” questi problemi per gli utenti aziendali.

In altre parole, l’IA generativa non sarà in grado di sostituire facilmente la conoscenza fondamentale dei dati.

Allora, cosa intendo per conoscenza dei dati “fondamentale”?

Per sostenere la mia risposta con i problemi elencati sopra, si riduce a tre concetti fondamentali:

  1. Creazione di un’Architettura dei Dati

Argomento: La conoscenza tecnica e la comprensione di come progettare un’architettura dei dati appropriata in un settore specifico sono cruciali.

Per esempio, permettetemi di darvi un esempio dall’industria fintech.

Nell’industria fintech, ci sono rigide normative, ovvero gli Standard di Sicurezza dei Dati PCI, che devono essere considerati quando si costruisce una piattaforma dati. Oltre a questi standard, talvolta ci sono normative basate sul mercato.

Ad esempio, in Svizzera, tra gli altri, ci sono le regolamentazioni FINMA che devono essere prese in considerazione per rendere la vostra piattaforma dati, e di conseguenza la vostra architettura dei dati, conforme.

Ovviamente, le normative sono soggette a modifiche, il che implica che l’architettura dei dati deve seguire queste modifiche. E questo pone una vera sfida per l’IA generativa.

La generazione di intelligenza artificiale può supportare la progettazione e lo sviluppo architettonico fino a un certo livello.

Ma non è in grado di progettare soluzioni architettoniche personalizzabili in settori in cui le normative sono in continua evoluzione.

Non possiede la capacità di applicare adattamenti architettonici specifici se non viene addestrata su esempi storici simili.

2. Gestione della qualità dei dati

Argomento: Il detto “spazzatura in, spazzatura fuori” sarà sempre valido, e tutti coloro che lavorano nel campo dei dati sanno esattamente quale sia il costo di una scarsa qualità dell’input dei dati.

Utilizzando soluzioni di intelligenza artificiale generativa, il costo di una scarsa qualità dell’output è ancora più alto.

Ad esempio, devo fare riferimento all’articolo recente che ho letto sul Guardian. Era un articolo su un avvocato che utilizzava ChatGPT per fornire esempi di casi legali precedenti simili. Voleva sostenere la sua argomentazione sul motivo per cui la causa del suo cliente contro la compagnia aerea non doveva essere respinta.

Credo che tu possa già immaginare come sia andata la storia: quando gli avvocati della compagnia aerea hanno verificato le decisioni citate e le citazioni legali, hanno scoperto che nessuna di esse era mai esistita. In breve, ChatGPT stava allucinando.

Per trarre le mie conclusioni da questo articolo, un output di scarsa qualità dei dati potrebbe costarti un’azienda e portare alla chiusura completa di un progetto o alla perdita dei clienti e della reputazione.

Pertanto, i professionisti dei dati saranno ancora più impegnati nella gestione della qualità dell’input e dell’output dei dati.

3. Privacy e sicurezza dei dati

Argomento: Come professionista dei dati, sei consapevole dei concetti di SQL injection e della sicurezza dei database.

Con gli sviluppi nell’intelligenza artificiale generativa e l’uso semplice di prompt, gli attacchi ai data warehouse e gli scenari di violazione dei dati sono più probabili che mai.

Il pericolo delle injection di prompt, ad esempio, la possibilità che con un solo input di testo qualcuno possa potenzialmente eliminare l’intero database o recuperare record confidenziali, deve essere posto al centro della sicurezza dei dati.

Ciò significa che i professionisti dei dati e dell’informatica continueranno a svolgere ruoli cruciali nella protezione e nella sicurezza dei dati.

Per riassumere: i professionisti dei dati con conoscenze dei concetti fondamentali dei dati rimarranno nel mondo del lavoro come “costanti” che gestiranno i dati in modo efficiente, identificheranno i problemi e ottimizzeranno soluzioni conformi, sicure e affidabili.

Questa è la parte che l’intelligenza artificiale generativa non sarà in grado di sostituire facilmente.

Quindi, se sei un giovane professionista in cerca di consigli su come far crescere la tua carriera nel campo dei dati nell’era dell’intelligenza artificiale generativa, inizia imparando i concetti fondamentali sopra elencati.

Fidati di me: investire tempo e risorse per acquisire conoscenze fondamentali sui dati ti ripagherà a lungo termine nella tua carriera nel campo dei dati.

L’intelligenza artificiale generativa accelererà la tua curva di apprendimento e le tue prestazioni lavorative in queste aree, ma ti aiuterà solo fino a un certo livello. Il “lavoro importante” sarà comunque affidato a te e alla tua conoscenza.