Archetipi del ruolo di Data Scientist

Archetipi Data Scientist

I ruoli nel campo della data science possono essere molto diversi e gli annunci di lavoro non sono sempre chiari. Quale cappello vuoi indossare?

Foto di Clem Onojeghuo su Unsplash

Dopo le risposte positive al mio recente articolo su Towards Data Science riguardo agli Ingegneri di Machine Learning, ho pensato di scrivere un po’ su quali sono, secondo me, le vere categorie di ruoli per i professionisti della data science nel mercato del lavoro. Mentre in precedenza parlavo dei candidati, ad esempio delle loro aspettative di qualifica e delle realtà che potrebbero incontrare, oggi voglio parlare di cosa si fa effettivamente ogni giorno nel lavoro.

Voglio dire che queste sono le cose che secondo me le persone assumono realmente i professionisti della data science per fare, che lo ammettano o meno. Sto per spiegare cosa fa realmente il lavoro, rispetto a ciò che potrebbe essere dichiarato nella descrizione del lavoro e in quale posizione (approssimativamente) potresti trovarti all’interno di un’organizzazione aziendale.

Perché è importante?

I data scientist alla ricerca di lavoro, indipendentemente dal punto in cui ci troviamo nella nostra carriera, dobbiamo leggere tra le righe quando valutiamo annunci e descrizioni di lavoro. Ci sarà molta esagerazione e eufemismo nella descrizione del lavoro e può essere difficile capire come sarebbe veramente il ruolo ogni giorno e quali competenze saranno necessarie per avere successo.

È anche importante sapere come saranno le mansioni in modo da poter capire se è ciò che vuoi fare del tuo tempo! Probabilmente ci sono parti del vasto campo della data science che ti piacciono più di altre e cose che vuoi imparare o approfondire maggiormente. Se finisci nel ruolo sbagliato, potresti ritrovarti in una carriera che non desideri.

Voglio che questo articolo ti aiuti a leggere tra le righe di quegli annunci di lavoro e a sapere cosa sarà realmente il lavoro prima di dedicare tempo all’applicazione e al colloquio. È importante anche sapere, mentre leggi tra le righe, se il ruolo pubblicizzato è veramente gestibile da una sola persona con successo. Come descriverò in seguito, a volte le aziende cercano di assumere un unico data scientist per ricoprire molte mansioni e ciò non è sostenibile né piacevole per la persona che viene assunta per quel ruolo.

I data scientist alla ricerca di lavoro, indipendentemente dal punto in cui ci troviamo nella nostra carriera, dobbiamo leggere tra le righe quando valutiamo annunci e descrizioni di lavoro. … Se finisci nel ruolo sbagliato, potresti ritrovarti in una carriera che non desideri.

Avvertenze

Prima di continuare, ho solo alcuni avvertimenti/note per il lettore.

  • Ho trascorso la maggior parte della mia carriera in aziende tecnologiche di dimensioni ridotte o medie e non ho esperienza personale nelle grandi aziende tecnologiche. Ho consultato amici che invece hanno tale esperienza per avere il loro feedback su questo, quindi spero che le mie generalizzazioni si applichino più o meno ovunque. Probabilmente ho torto.
  • Tutti questi sono generalizzazioni. Anche se penso che queste idee siano vere, ci sono delle battute qui. Per favore, non prendere tutto troppo sul serio, ma riconosci che sto facendo una piccola risata a spese del nostro strano settore.
  • Lo ribadirò più avanti, ma ricorda che questi sono archetipi, non “il testo esatto della descrizione di lavoro di qualcuno”. Gli archetipi sono utili per raggruppare le cose, ma nella vita reale ci saranno eccezioni, amalgami e altri casi particolari.

Ora, procediamo e iniziamo a parlare degli archetipi dei data scientist!

L’esperto di analisi

Inizio con il ruolo più sottovalutato e sottovalutato: l’analisi. Sei lì per aiutare l’azienda a capire se sta raggiungendo gli obiettivi e se le cose stanno funzionando come dovrebbero. Questo è estremamente importante e molto vago e difficile da fare effettivamente. Ci sono molte cose possibili che potresti fare ogni giorno, come costruire dashboard, analizzare cose come le vendite e il successo dei prodotti e potenzialmente anche guardare cose come le prestazioni interne (pensate al turnover e altre cose). Alcune persone penseranno che il tuo lavoro consista solo nel “farmi una dashboard”, ma anche se ti occupi di dashboarding, passerai molto tempo a pensare a cosa dovrebbe essere misurato nella dashboard, se dovrebbe esistere del tutto e come puoi calcolare metriche che si allineino effettivamente agli obiettivi.

In un decennio precedente, potresti essere stato chiamato Operations Analyst o BI Specialist (o talvolta ancora oggi potresti essere chiamato così). Ci si aspetta che tu gestisca molti dati strani da fonti strane e che utilizzi molta SQL. Non farai molto machine learning a meno che non si tratti di cose come NLP sulle risposte dei feedback. Se stai analizzando l’efficacia del prodotto, farai molto A/B testing. Potresti essere nel dipartimento di marketing o in un dipartimento di analisi autonomo, ma probabilmente persone provenienti da tutto l’azienda ti chiederanno spesso “i numeri” per varie cose.

Il Costruttore di Funzionalità

Tu, d’altra parte, sei qui per migliorare il prodotto, idealmente con un po’ di magia di DS/ML. I tuoi dirigenti probabilmente vogliono poter dire che il vostro prodotto contiene l’AI, anche se hai solo un motore di raccomandazione che suggerisce nel prodotto o che ordina i risultati di ricerca. Se hai fortuna, potresti avere l’opportunità di creare funzionalità innovative e aggiungere cose interessanti al prodotto, ma se non ti trovi bene a partire da una pagina vuota e da un mandato vago, potrebbe non essere il posto giusto per te.

Devi conoscere i clienti e il settore per poter creare cose utili, non solo belle. Dovresti ascoltare ciò che dicono i clienti e parlare con i reparti che sono a contatto con i clienti, ma spesso le persone in questo ruolo non lo fanno. (Questa è una scelta sbagliata.) Potresti fare il tuo A/B testing, o potrebbe essere compito dell’Analista di Analisi. Hai sicuramente bisogno dell’Analista di Analisi (o sovrapposizione con lui) quando si tratta di valutare se ciò che hai costruito è stato buono. Lavori in Python. Probabilmente sei nel dipartimento di prodotto, ma parli spesso con l’ingegneria.

Il Costruttore di Infrastrutture

Un po’ correlato, penso che questo sia più appropriatamente chiamato ML Engineer: ti verrà chiesto di creare i meccanismi che prendono un nuovo modello e lo inseriscono nel prodotto in modo che i risultati di ricerca siano ordinati per rilevanza o il nuovo widget venga mostrato alle persone appropriate o qualsiasi altra cosa. A volte avrai a che fare direttamente con il funzionamento di un modello stesso, ma non così spesso (a meno che non si rompa e tu venga chiamato – sei il tipo di data scientist più probabile ad avere un turno di chiamata.) La scalabilità e la parallelizzazione saranno importanti per te, e dovrai sviluppare una profonda fascinazione per la latenza e il ritardo, quindi abituati a questo.

Il tuo kit quotidiano include Docker, il linguaggio in cui è scritto il prodotto e Python, perché prendi ciò che il Costruttore di Funzionalità crea e lo inserisci nel prodotto. Uno strumento di osservabilità di qualche tipo sarà anche tra i tuoi preferiti. Probabilmente sei in un dipartimento di ingegneria, o forse devops.

L’Esclusivamente Interno

Questo non è molto comune finché non si arriva alle grandi aziende, ma sei una persona che sta costruendo strumenti di ML per altri dipartimenti interni alla tua azienda. Non è molto diverso dal Costruttore di Funzionalità, tranne che i modelli che crei sono solo per l’uso all’interno della tua azienda, per rendere le cose migliori. I tuoi clienti sono le altre persone che lavorano nella tua azienda, non persone esterne che pagano la tua azienda per beni/servizi. Di conseguenza, non hai bisogno di conoscere così tanto i clienti esterni, ma conoscerai molto bene l’organigramma dell’azienda.

Per avere successo, scopri quali sono le cose ripetitive e fastidiose che i tuoi colleghi devono fare e automatizzale/allena un modello per farlo al loro posto. Se lo fai, sarai molto popolare. A volte ciò che crei potrebbe diventare open source e alla fine potrebbe diventare un prodotto, come Airflow o H3. Probabilmente sei in ingegneria.

Il Ricercatore

Una specie rara, sei qualcuno assunto per fare ricerca pura. Forse scriverai articoli accademici e aumenterai la visibilità della tua azienda, o qualcosa del genere, ma non si aspettano che questo ruolo si mantenga da solo. Questo ruolo probabilmente rientra nei progetti speciali del CEO o qualcosa del genere. Ti verranno proposte idee interessanti che qualcuno ha letto online e ti verrà chiesto di capire di cosa si tratta e come la tua azienda può fare qualcosa in quel settore. Ti taggheranno in tutte le conversazioni su LLM su Slack. Questo è l’unico ruolo possibile in tutto questo post che potrebbe giustificatamente richiedere un dottorato di ricerca.

L’Ingegnere delle Soluzioni

Invece di costruire funzionalità di data science per la tua azienda, le costruirai per i tuoi clienti. Questo include lavori di consulenza in data science, anche se le aziende che costruiscono e vendono software legato alla data science sono anche dove si trova comunemente questo ruolo. Se i tuoi clienti hanno bisogno di competenze specializzate in DS/ML per sfruttare al meglio il tuo prodotto, è probabile che l’azienda abbia alcuni di questi ruoli.

Prevedi a partecipare alle chiamate dei clienti quando cercano di vendere qualcuno sugli elementi fantastici dell’intelligenza artificiale del tuo prodotto o servizio, perché il reparto vendite non si sente a suo agio nel rispondere alle domande tecniche. Hai un set di competenze tecnologiche abbastanza vario perché i tuoi clienti possono presentarsi con ogni tipo di stranezze per cui hai bisogno di aiuto o che devi costruire, il che può essere davvero divertente. Devi capire l’industria, come The Feature Builder, e devi essere in grado di essere raffinato e paziente con i clienti. Poiché trascorri del tempo a interagire con i clienti, potresti lavorare nei dipartimenti di successo del cliente o vendite.

E finalmente arriviamo a..

Il Tutto per Tutti

Questo è il ruolo che sembra combinare varie parti di tutti questi lavori, spesso in modo disorganizzato, e o il responsabile delle assunzioni non si rende conto che sono tre o quattro lavori o spera di convincere qualcuno a farli tutti per un solo stipendio. Lo stipendio è probabilmente troppo basso per quello che ti verrà chiesto di fare. Questo è comune nelle organizzazioni che non hanno una funzione di data science esistente e che stanno assumendo il loro primo responsabile di data science. Può essere un’opportunità per imparare molto attraverso l’esperienza, ma probabilmente non ci sarà nessuno con competenze tecniche più avanzate in grado di insegnarti, quindi le tue capacità di ricerca su Google/StackOverflow/altro devono essere di alto livello. Se non ti piace imparare da solo cose nuove, questo ruolo può essere difficile e isolante. Come ha detto un mio amico, “Sarai il migliore dell’azienda in quello che fai, ma questo non significa che sei bravo in quelle cose”. A causa della mancanza di mentorship/persone che ti aiutano, il rischio di burnout è reale.

Ma davvero…

Per essere chiari, la maggior parte dei lavori di data science/machine learning conterrà parti di forse due di questi ruoli, o più. Ricorda che ti ho detto che questi sono archetipi, non “la mia descrizione del lavoro”. (Letteralmente, il mio stesso lavoro non rientra in una sola di queste categorie.)

Per essere chiari, la maggior parte dei lavori di data science/machine learning conterrà parti di forse due di questi ruoli, o più.

Esempi di divisioni a due vie:

  • Data scientist per l’analisi del prodotto: l’Analytics Guru incrociato con The Feature Builder. Costruisci funzionalità, fai tutte le tue analisi e fai anche analisi di altre funzionalità/cose che le persone stanno costruendo.
  • Data scientist per il machine learning full stack: The Feature Builder e The Infra Builder. Stai costruendo il modello così come i sistemi che servono quel modello al mondo.

Se stai coprendo tre o più archetipi diversi in un singolo ruolo, allora direi che è troppo disperso. Una persona non può essere con successo l’Analytics Guru, The Feature Builder e The Infra Builder, ad esempio – è troppi piatti da far girare. Più l’azienda è piccola, più è probabile che ti troverai a dover indossare cappelli extra, ma riconosci che queste sono funzioni diverse e puoi essere troppo diluito.

Alcune Ulteriori Note Prima di Andare

Credo che mano a mano che aumenti di anzianità nella tua carriera di data science/machine learning, finirai per assumere più ruoli e i confini di “cosa fa il mio lavoro” diventeranno più sfumati e grigi. Sviluppi competenze ed esperienze che possono essere utili in molte parti diverse dell’azienda e le persone ti chiameranno per avere il tuo parere su varie questioni.

Inoltre, non ho parlato molto di strategia o pianificazione qui dentro, ma mano a mano che aumenta la tua anzianità, sarai più coinvolto in tutto questo tipo di cose. Anche come singolo contributore, la tua esperienza ha valore – probabilmente hai già visto qualcosa di simile a quell’idea o problema che è attualmente all’ordine del giorno. Dovresti dare il tuo parere su come affrontarlo, anche se le persone responsabili decidono in modo diverso. Questo fa parte del lavoro ai livelli più alti.

Non ho parlato molto di strategia o pianificazione qui dentro, ma mano a mano che aumenta la tua anzianità, sarai più coinvolto in tutto questo tipo di cose.

Spero che questo possa aiutare le persone che sono sul mercato o gli studenti che stanno entrando nel campo a avere una comprensione più chiara di ciò a cui si stanno avvicinando. Se trovi un esempio davvero eclatante di Il Tutto per Tutti in giro, su un sito di annunci di lavoro, mandamelo o pubblica un link in un commento qui. Forse potrò fare un post in futuro sugli esempi peggiori e analizzarli per il divertimento di tutti!

Puoi trovare altri miei lavori su www.stephaniekirmer.com.