Sostituirà ChatGPT i Data Scientist?

No, ChatGPT non sostituirà i Data Scientist.

Ogni lavoro è a rischio. Ecco come puoi rendere la tua carriera immune all’IA.

Se lavori nell’industria dei dati o aspiri a farlo, potresti chiederti se è arrivato il momento di cambiare carriera.

I modelli generativi come ChatGPT segneranno la fine degli scienziati dei dati?

Come qualcuno che ha lavorato nel campo dei dati per tre anni, vorrei esprimere la mia opinione in proposito.

In un articolo che ho scritto qualche tempo fa, ero fortemente contrario all’idea che il software AI automatizzato potesse mai sostituire gli scienziati dei dati. Il mio argomento era che questi strumenti avrebbero migliorato l’efficienza organizzativa fino a un certo punto, ma mancavano di personalizzabilità e richiedevano il coinvolgimento umano in ogni fase.

Ma questo era nel febbraio 2022, molto prima che fosse rilasciato ChatGPT, il rivoluzionario modello di linguaggio di OpenAI.

Quando ChatGPT è stato reso pubblico per la prima volta, era basato su GPT-3.5, un modello in grado di comprendere il linguaggio naturale e il codice.

Poi, nel marzo 2023, è stato rilasciato GPT-4. Questo algoritmo supera il suo predecessore nella risoluzione di problemi basati sulla logica, la creatività e il ragionamento.

Ecco alcuni fatti su GPT-4:

  • È in grado di scrivere codice (in modo davvero eccellente)
  • Ha superato l’esame di abilitazione alla professione forense
  • Ha superato la maggior parte dei modelli all’avanguardia nei benchmark di apprendimento automatico

Questo modello può trasformare uno schizzo in un sito web completo ed è un grande assistente per la programmazione e le attività di data science.

E viene già utilizzato dalle organizzazioni per migliorare l’efficienza.

Il CEO di Freshworks, Girish Mathrubootham, afferma che i compiti di programmazione che una volta richiedevano ai suoi dipendenti 9 settimane per essere completati vengono ora effettuati in pochi giorni con ChatGPT.

Grazie all’IA generativa, i flussi di lavoro di codifica in questa azienda vengono completati circa 20 volte più velocemente del solito. Ciò porterà a una massiccia riduzione dei tempi di attesa, il che significa che le aziende possono fare di più in meno tempo.

Il lato negativo – perché il tuo lavoro è a rischio

Integrazioni di prodotto

Fino ad ora, abbiamo parlato solo di programmazione.

Ci sono altri aspetti del lavoro di uno scienziato dei dati – come la preparazione dei dati, l’analisi, la visualizzazione e la costruzione di modelli.

Nella mia esperienza, gli scienziati dei dati sono attualmente molto richiesti a causa della varietà di abilità diverse che si aspetta che abbiano.

Oltre a costruire modelli statistici e imparare a programmare, questi professionisti devono anche utilizzare SQL per l’estrazione dei dati, lavorare con software come Tableau e PowerBI per la visualizzazione e comunicare in modo efficace le intuizioni agli stakeholder.

Tuttavia, con LLM come ChatGPT, la barriera per entrare in un campo come la data science o l’analisi dei dati diminuirà enormemente. I candidati non hanno più bisogno di possedere competenze in vari software, ma possono invece sfruttare il potere degli LLM per realizzare in pochi minuti ciò che normalmente richiederebbe ore.

Ad esempio, in un’azienda con cui ho lavorato in passato, mi è stato chiesto di completare una valutazione di Excel con limite di tempo poiché la maggior parte del database dell’organizzazione risiedeva in fogli di calcolo. Volevano assumere qualcuno in grado di estrarre e analizzare rapidamente questi dati.

Tuttavia, questa necessità di assumere candidati con competenze nell’uso di strumenti specifici scomparirà man mano che aumenterà l’adozione degli LLM.

Ad esempio, con un’integrazione ChatGPT-Excel, potresti semplicemente evidenziare le celle che vuoi analizzare e chiedere agli LLM domande come “Qual è la tendenza di questi numeri di vendita nell’ultimo trimestre?” o “Puoi eseguire un’analisi di regressione?”

Integrazioni di prodotto come questa renderanno Excel e altri software simili accessibili a persone che normalmente non li utilizzano e la domanda di esperti nell’uso degli strumenti diminuirà.

Plugin di codice

Il plugin di interpretazione del codice di ChatGPT è un altro esempio di come i flussi di lavoro della data science stanno diventando democratizzati. Consente di eseguire il codice Python e analizzare i dati nella chat.

Puoi caricare file CSV e far sì che ChatGPT ti aiuti a pulirli, analizzarli e costruire modelli statistici su di essi.

Una volta che hai analizzato i dati e gli hai detto cosa vuoi fare (ad esempio, prevedere i numeri di vendita per il prossimo trimestre), ChatGPT ti dirà i passaggi che puoi compiere per raggiungere il risultato finale.

Poi procederà ad effettuare l’analisi e la modellazione effettiva per te, spiegando l’output ad ogni fase del processo.

In questo articolo, l’autore chiede all’interprete di codice di ChatGPT di predire le future tendenze inflazionistiche utilizzando i dati economici della Federal Reserve (FRED). L’algoritmo ha iniziato visualizzando la tendenza attuale dei dati.

Poi ha verificato la stazionarietà dei dati, li ha trasformati e ha deciso di utilizzare ARIMA per effettuare la modellazione. È stato persino in grado di trovare i parametri ottimali da utilizzare per generare previsioni con ARIMA:

Questi sono passaggi che di solito richiederebbero a un data scientist circa 3-4 ore per essere eseguiti, ma ChatGPT è stato in grado di farlo in pochi minuti semplicemente elaborando i dati caricati dall’utente.

È un risultato impressionante, che ridurrà drasticamente il livello di competenza richiesto per facilitare il processo di costruzione del modello.

Quindi…È ancora necessaria l’esperienza umana?

Ovviamente, nonostante l’ottimo lavoro dell’AI nella scrittura del codice e nella costruzione dei modelli, è ancora necessaria la supervisione di esperti umani durante il processo.

ChatGPT spesso genera codice errato e prende decisioni sbagliate nella costruzione di modelli statistici. Le aziende devono ancora assumere dipendenti esperti in statistica e programmazione per supervisionare il processo di data science, al fine di garantire che il modello sia correttamente sviluppato.

LLM non può creare prodotti di dati completi, poiché gli esseri umani devono ancora svolgere compiti come la raccolta dei requisiti, il debug e la convalida dell’output del modello.

Tuttavia, le aziende avranno meno bisogno di persone per svolgere questi compiti rispetto a prima.

Gli importanti miglioramenti di efficienza come quelli apportati da LLM significheranno che le squadre potranno ridurre le dimensioni.

Ad esempio, invece di assumere 10 data scientist per fare il lavoro, le aziende potranno semplicemente assumerne 5.

Credo che i lavori di data science di livello base saranno i primi a essere influenzati da questo sviluppo, poiché LLM può già eseguire la codifica di livello intermedio e i flussi di lavoro analitici.

Le assunzioni bloccate a causa dell’AI sono già in corso nelle grandi aziende tecnologiche, e potremmo assistere a una situazione in cui la forza lavoro della data science supera la domanda di questa competenza.

Come proteggere la tua carriera nell’era di ChatGPT

Fortunatamente, non è tutto nero su bianco per noi professionisti della tecnologia e della data science. Anche se LLM sta migliorando rapidamente in attività come la programmazione e l’analisi dei dati, non può sostituire la creatività e la presa di decisioni umane.

Ecco alcuni modi per proteggere la tua carriera nell’era di LLM:

Acquisisci competenze aziendali

Le organizzazioni continueranno ad assumere persone che generano ricavi per l’azienda.

Se hai competenze nel settore specifico e comprendi le complessità delle operazioni dell’azienda e le esigenze dei clienti, sei in una posizione unica per individuare opportunità di crescita.

L’ultima cosa che vuoi fare è competere con l’AI: non vuoi essere il responsabile di un foglio di calcolo, o la persona a cui tutti si rivolgono per creare un rapporto trimestrale sulle prestazioni. Questi lavori possono essere facilmente automatizzati e saranno i primi a essere eliminati nell’era di ChatGPT.

Sostengo che invece di concentrare i tuoi sforzi nell’apprendimento di un software specifico che LLM può imparare molto più velocemente rispetto a te, impara a guardare l’immagine più ampia. Sviluppa competenze di leadership e gestione e comprendi come l’AI possa essere sfruttata per raggiungere gli obiettivi dell’azienda con i dati.

Abbraccia l’AI

Secondo il Pew Research Center, solo il 14% degli adulti ha effettivamente provato ChatGPT. Se stai leggendo questo articolo, usando ChatGPT per imparare cose nuove e rimanendo al passo con gli sviluppi dell’AI, allora sei un early adopter.

Suggerisco di incorporare LLM nei tuoi flussi di lavoro, utilizzando prodotti integrati con l’AI e imparando le migliori pratiche per massimizzare l’efficienza con questi modelli.

In questo modo, puoi rimanere un passo avanti e capire meglio quali parti del tuo lavoro possono essere automatizzate e quali richiedono l’intervento umano.

Questo non solo ti renderà un miglior data scientist, ma quando le organizzazioni inizieranno ad incorporare l’AI in diverse aree aziendali, sarai nella migliore posizione per consigliare su come utilizzarla per aumentare la produttività.

In effetti, è emerso di recente un nuovo ruolo chiamato “ingegneria delle indicazioni” che offre salari fino a $335.000. Un ingegnere delle indicazioni è un esperto nel far sì che le applicazioni di intelligenza artificiale generativa facciano ciò che si desidera.

Un buon ingegnere delle indicazioni è qualcuno che sa “gestire” l’IA per ottenere risultati come la progettazione di applicazioni web.

Indipendentemente dal fatto che tu voglia intraprendere una carriera come ingegnere delle indicazioni, incorporare l’IA nei tuoi flussi di lavoro esistenti ti darà un vantaggio competitivo rispetto a coloro che attualmente non lo fanno.

Diversificare il reddito

Le organizzazioni inizieranno presto a riorganizzarsi, sviluppando nuove strategie aziendali che includono l’IA.

Se ciò comporta licenziamenti di massa, l’unico modo per proteggerti è avere diverse fonti di reddito che non dipendano esclusivamente dal tuo lavoro a tempo pieno.

Ti suggerisco di creare un portfolio freelance: lavorare per più di un’organizzazione e ottenere un reddito passivo garantirà che il tuo futuro non dipenda dalle decisioni prese da un singolo datore di lavoro.

Creare un brand personale

Infine, Harvard Business Review suggerisce di creare un brand personale per distinguerti dalla massa.

Scrittori come Tim Denning e Jessica Wildfire, ad esempio, avranno comunque una base di seguaci devoti e persone che consumano i loro prodotti, anche se l’IA sarà in grado di emulare il loro stile di scrittura.

Questo perché alla fine delle giornate, gli esseri umani amano le storie vere e vogliono sentirsi collegati ad altre persone, e questo è qualcosa che l’IA semplicemente non può fornire.

Allo stesso modo, le organizzazioni continueranno ad assumere leader del settore riconosciuti come garanzia di qualità e branding. Alcuni modi per costruire un brand personale includono la creazione di un portfolio di scienze dei dati, la creazione di contenuti e il continuo miglioramento delle competenze.

Conclusioni

I modelli generativi trasformeranno il panorama lavorativo e settori come la scienza dei dati, l’analisi e la programmazione subiranno impatti grazie ai vantaggi di efficienza offerti da questi strumenti.

Tuttavia, questo non segna la fine per i data scientist. Seguire le strategie descritte sopra può aiutarti a rimanere al passo con i tempi e garantire che tu non sia in competizione con l’IA. Natassha Selvaraj è una data scientist autodidatta con una passione per la scrittura. Puoi connetterti con lei su LinkedIn.