Sono ancora necessari i Data Scientist nell’era dell’AI generativa?

Are Data Scientists still necessary in the age of generative AI?

L’ascesa di ChatGPT.

Esattamente 2 anni fa, ho scritto un pezzo di opinione chiamato “I Data Scientist Saranno Estinti in 10 Anni”. Per mia sorpresa, sarebbe diventato uno dei miei articoli più letti sia su Nisoo che su Nisoo. Tuttavia, la risposta è stata polarizzante. Ha attirato la maggior parte delle critiche che ho ricevuto nella mia vita adulta. Ho predetto la fine del lavoro più sexy (e uno dei più richiesti) del 21 ° secolo e i miei colleghi hanno avuto problemi, ma ho accettato il feedback e la vita è andata avanti. Vai avanti ora; e che differenza fanno due anni. ChatGPT ha conquistato il mondo e con esso, la narrazione che un ruolo specifico sarà gradualmente eliminato è stata eclissata da un altro con implicazioni molto maggiori; l’obsolescenza del capitale umano in ogni possibile industria.

La rivoluzione sembra essere avvenuta durante la notte. Ma quelli di noi che hanno seguito da vicino i progressi dell’apprendimento profondo sanno bene che non è stato così. ChatGPT è stata l’accumulo di decenni di ricerca che ha culminato inspiegabilmente in un modesto chatbot. Al centro del successo di ChatGPT c’è il fatto che democratizza l’AI. Essere competenti nel codice e avere una conoscenza tecnica approfondita non sono più barriere all’ingresso, l’accessibilità all’apprendimento profondo all’avanguardia ha superato il dominio della ricerca accademica e delle grandi aziende tecnologiche per essere disponibile a portata di mano di chiunque abbia accesso wifi e un indirizzo email.

Perché i Data Scientist sono Estinti?

Mai nei miei sogni più sfrenati ho pensato che fossimo sull’orlo di una rivoluzione tecnologica della velocità, della scala e della natura che abbiamo sperimentato? Prima dei modelli LLMs e Text to Image, l’AI generativa (GAI) era in gran parte sinonimo dei Generative Adversarial Networks (GANs) di Ian Goodfellow. È stato accolto come uno dei grandi contributi della ricerca sull’AI degli ultimi anni, manifestandosi nella capacità di utilizzare una coppia di reti neurali per generare immagini sintetiche fotorealistiche. Quelli di noi che hanno lavorato con GAN sanno che sono notoriamente difficili da addestrare e anche quando implementati correttamente, gli utilizzi in quel momento erano limitati. Pertanto, è ancora più sorprendente che l’apprendimento profondo generativo abbia annunciato l’ultimo round di avanzamenti.

Quindi perché ChatGPT (e i suoi compagni GAI) porterebbero i data scientist sull’orlo dell’estinzione? Rivediamo la tesi originale di due anni fa:

  1. La capacità di rigurgitare codice e utilizzare pacchetti software non definirà più un data scientist poiché le soluzioni low / no-code erano già diventate prevalenti.
  2. La capacità di lavorare ed analizzare i dati diventerà un set di competenze presumibile per molti ruoli, proprio come le competenze informatiche e la conoscenza di MS Office.
  3. In questo paradigma, i specialisti di dominio che possono risolvere problemi reali eccelleranno. La scienza dei dati diventerà parte del loro toolkit.
  4. Dato ciò, i data scientist generalisti saranno gradualmente eliminati a favore degli esperti di dominio.

Dato ciò, possiamo vedere che GAI facilita quasi tutti i punti sopra. Può generare codice, analisi di set di dati e risultati di query direttamente da prompt di testo. La richiesta di professionisti pronti per l’AI che possano utilizzare ChatGPT è già iniziata ad apparire nelle descrizioni del lavoro e sappiamo che nonostante i guadagni di produttività che derivano dall’utilizzo di GAIs, l’AI è ancora incline alle allucinazioni, può ancora sbagliare, rafforzando la necessità di una profonda competenza di dominio per affrontare questi casi. In sintesi, non sono stati necessari 10 anni, sono bastati solo due.

Tuttavia, l’estinzione dei data scientist non significa che gli esseri umani che fanno la scienza dei dati diventeranno obsoleti, anzi. Quando guardiamo indietro nella storia, negli ultimi 200 anni abbiamo assistito a diverse rivoluzioni tecnologiche, che hanno incluso l’introduzione della potenza del vapore, la produzione di massa e l’informatica personale per citarne alcune. Ognuno ci ha permesso di essere più produttivi del precedente poiché i nostri ruoli e le nostre relazioni con la tecnologia si sono evoluti, questo concetto è ben radicato nella teoria economica (Solow Growth Model). Nell’attuale ambiente, le aziende stanno creando e catturando più dati che mai, quindi le competenze della scienza dei dati saranno sempre richieste, ma i data scientist del futuro non saranno chiamati data scientist, andranno con nomi come product manager, specialisti di marketing o analisti di investimenti. I data scientist sono estinti, viva la scienza dei dati.

Avviso: le opinioni e i pensieri sono del solo autore.

Michael Wang è un professionista degli investimenti e della scienza dei dati con oltre 10 anni di esperienza nel settore in vari ruoli all’interno delle fintech, degli investimenti, del trading e dell’insegnamento. È il consulente principale e fondatore di WhyPred, una consulenza di analisi che si specializza nel combinare l’esperienza dei mercati finanziari con l’AI e il machine learning.