Dominare l’universo dei dati passi chiave per una carriera fiorente nella scienza dei dati

Dominare l'universo dei dati la chiave per una carriera fiorente nella scienza dei dati

 

Per sviluppare una carriera di successo nella scienza dei dati, è necessario rafforzare ciò che considero essere i sei pilastri principali dell’area: competenze tecniche, costruzione di un portfolio, networking, soft skills e infine sviluppare una specializzazione di nicchia. Una volta che hai tutto questo, è anche necessario svolgere bene la fase di colloquio.

Troppi aspiranti data scientist pensano che tutto si riduca alle competenze e trascurano la rete. Oppure ti affidi a un contatto nella rete per ottenere un colloquio di lavoro, ma cadi sotto pressione e non dimostri le tue competenze al meglio.

 

1. Educazione e Sviluppo delle Competenze

 

Nessuna di queste sezioni è davvero opzionale, ma questa è probabilmente la più importante delle sei. Potresti riuscire a ottenere un lavoro se non conosci le persone giuste o se il tuo portfolio non è perfetto, ma se non hai le giuste competenze, non otterrai il lavoro. O peggio: potresti ottenere il lavoro, ma fallire. E essere licenziato.

Ecco su cosa dovresti concentrarti:

 

Impara le fondamenta

 

Ogni lavoro di data science richiede una solida base di matematica, statistica e programmazione. La competenza in linguaggi come Python o R è essenziale. Quasi ogni descrizione di lavoro di data science menzionerà uno di questi due linguaggi.

Ti suggerisco anche di considerare l’apprendimento di SQL come requisito fondamentale. I database SQL sono una realtà nella vita dei data scientist. Ed è un linguaggio relativamente semplice da imparare.

 

 

Machine learning e manipolazione dei dati

 

Non è solo la recente crescita dell’IA; i data scientist hanno sempre avuto bisogno di padroneggiare l’apprendimento automatico. Dovrai acquisire competenze negli algoritmi di machine learning, nella pre-elaborazione dei dati, nell’ingegneria delle caratteristiche e nella valutazione dei modelli.

 

Visualizzazione dei dati

 

I risultati di un data scientist sono privi di valore a meno che non possa comunicarli ad un altro. Ciò si fa con grafici, tabelle e altri tipi di visualizzazioni dei dati. Dovrai padroneggiare strumenti e tecniche di visualizzazione dei dati per comunicare efficacemente le intuizioni provenienti dai dati ai principali interessati della tua azienda.

Approfondirò un po’ di più questo argomento quando parlerò delle soft skills, la comunicazione è una competenza vitale.

 

Tecnologie Big Data

 

Sono passati i tempi in cui i data scientist lavoravano con dati limitati, se mai è successo. Oggi è necessario essere estremamente familiari con i big data e gli strumenti necessari. Anche se la tua azienda non gestisce dati veramente “grandi”, aspirerà a farlo.

Familiarizza con strumenti come Hadoop, Spark e piattaforme cloud per gestire grandi dataset.

 

2. Costruisci un Portfolio solido

 

Passiamo al pilastro numero due: il tuo portfolio.

C’è una carenza di data scientist qualificati, come probabilmente saprai. I diplomati dei bootcamp sono aumentati per colmare il vuoto. Ma questo ha causato un nuovo problema: la mancanza di fiducia. Le aziende sanno che un diploma non è necessariamente un requisito indispensabile per svolgere un buon lavoro. Tuttavia, i cattivi bootcamp hanno anche fatto ottenere ai futuri data scientist una cattiva reputazione, perché molti bootcamp hanno prodotto “laureati” che non sapevano la differenza tra un join e una subquery. Perciò, il tuo portfolio personale è l’occasione per dimostrare di saper fare sul serio. (È anche opportuno notare che i bootcamp sono molto costosi, soprattutto se confrontati con le prospettive di lavoro attualmente un po’ meno ottimistiche.)

 

Ecco cosa ti serve:

 

Progetti personali

 

Lavora su progetti personali che mettano in mostra le tue competenze. Questi potrebbero essere competizioni Kaggle, contributi open-source o tuoi progetti di analisi dei dati. Puoi mantenere un repository ben organizzato su GitHub per mostrare i tuoi progetti, campioni di codice e contributi.

 

Blog o sito web

 

Valuta la possibilità di creare un blog o un sito web personale in cui puoi condividere approfondimenti, tutorial e case study legati alla scienza dei dati. È possibile imbrogliare il sistema e assumere qualcuno che lo faccia per te, ma è così costoso e dispendioso in termini di tempo che poche persone cercano di falsificarlo. Un blog rappresenta un ottimo portfolio delle tue conoscenze.

Sii pronto a spiegare i tuoi progetti, le metodologie e gli approcci risolutivi. Ripassa le domande comuni di interviste sulla scienza dei dati e le sfide di programmazione.

 

3. Networking

 

Ricorda la regola d’oro dei lavori, indipendentemente dal settore: potenzialmente fino al 70% delle offerte di lavoro non viene mai pubblicizzato. Questo è un dato vecchio, ma anche se fosse dal 20 al 30 percento, dimostra che le persone che conosci hanno importanza. Senza nemmeno considerare che fino a un terzo delle offerte di lavoro pubblicate sono in realtà finte, pensate per far sembrare un’azienda più di successo di quanto non sia. Una rete di contatti personale può aiutarti a evitare sprechi di tempo.

Ecco cosa dovresti fare:

 

Unisciti a reti professionali

 

Partecipa a comunità di scienze dei dati e partecipa a incontri, conferenze e webinar per connetterti con altri professionisti del settore. Questo approccio più formale alla creazione di una rete può aiutarti a incontrare le persone giuste, a fare colpo nel tuo settore e a rimanere aggiornato sugli eventi attuali.

 

Social media

 

In modo più informale, dovresti anche interagire su piattaforme come LinkedIn, Twitter e forum pertinenti per condividere il tuo lavoro, le tue intuizioni e imparare dagli altri.

 

4. Soft Skills

 

Ricorda, le hard skills sono solo metà della battaglia. Ecco perché devi assicurarti di non trascurare le tue soft skills. Non sto dicendo che le soft skills sono più importanti. La dicotomia tra hard skills e soft skills è falsa: entrambe sono importanti. Ma le aziende non assumono macchine per la scienza dei dati, assumono persone. Ecco le aree su cui consiglio di concentrarti:

 

Comunicazione

 

Ricorda quella competenza nella visualizzazione dei dati? Gli scienziati dei dati devono comunicare in modo efficace risultati complessi e tecnici a stakeholder non tecnici. È incredibile quanto sia importante spiegare perché qualcuno nel marketing dovrebbe capire il grafico carino.

 

Risoluzione dei problemi

 

È quasi diventato un termine privo di significato, quindi assicurati di comprendere davvero cosa significa “risoluzione dei problemi”. Nel contesto della scienza dei dati, risolvere i problemi non significa solo debuggare. Significa anche sapere quando ha senso collaborare con diversi dipartimenti, quando rivedere lo stack tecnologico di un progetto per soddisfare nuove specifiche o tornare indietro sul tuo modello se si impantana sul set di dati di test.

 

 

Pensiero critico

 

Un altro termine quasi privo di significato che merita un’approfondita riflessione. Il pensiero critico significa la capacità di analizzare i dati da diverse angolazioni, mettere in discussione le ipotesi e pensare in modo creativo per ricavare intuizioni significative.

 

Lavoro di squadra

 

Gli scienziati dei dati non lavorano in un vuoto. Lavorerai con sviluppatori web, analisti dei dati, analisti aziendali, marketer, venditori e CXO. Collabora con team cross-funzionali per comprendere le esigenze aziendali e allineare soluzioni basate sui dati.

 

5. Specializzazione nell’industria

 

Non hai sentito? Siamo nel bel mezzo di un inverno tecnologico per le assunzioni. I soldi dei venture capital non stanno più affluendo come una volta e le aziende stanno stringendo la cinghia. Non è un buon momento per essere un generalista. Dovrai specializzarti per sopravvivere.

 

Scegli una nicchia

 

La data science si estende in diversi settori, come la sanità, la finanza, il commercio e altro ancora. Specializzarsi in un settore specifico può renderti più attraente per i datori di lavoro in quel campo. Cerca ciò che ti interessa naturalmente o dove potresti già avere conoscenze extra.

 

Conoscenze specifiche del settore

 

Acquisisci conoscenze specifiche del settore rilevante per l’industria in cui desideri lavorare. Ciò ti aiuta a comprendere le sfumature dei dati e a prendere decisioni più informate. Ad esempio, se vuoi lavorare in Google, dovrai conoscere le insidie degli algoritmi di ricerca e il comportamento degli utenti.

 

6. L’intervista

 

Ultima, ma non per importanza: preparati per le interviste. Puoi dominare i primi cinque pilastri e ancora inciampare sul traguardo. Ecco come ti consiglio di prepararti:

 

Spiegazioni

 

Puoi conoscere un concetto senza essere in grado di spiegarlo agli altri. Per i colloqui, dovrai essere pronto a spiegare i tuoi progetti, le metodologie e gli approcci di risoluzione dei problemi.

Dedica del tempo per assicurarti di avere una comprensione completa di cosa hai fatto, perché l’hai fatto e perché funziona per tutti i tuoi progetti, ma che sei anche in grado di spiegarlo abbastanza bene da poter essere compreso anche da una persona non esperta. (questo è anche un ottimo modo per esercitare quella competenza “comunicazione”.)

 

Preparazione al coding

 

La lavagna bianca è un famoso pilastro dei colloqui di codifica, eppure molte persone panico quando si trovano di fronte a quella superficie bianca e vuota. Più ti eserciti a rispondere alle domande dei colloqui in anticipo, meglio ti comporterai sotto pressione il giorno dell’intervista.

 

Come sviluppare una carriera di successo nella data science

 

È un po’ presuntuoso anche solo pretendere che ci sia una sola risposta giusta qui, o che possa essere spiegata in un articolo. Speriamo che questo post del blog funzioni più come una mappa stradale che come una soluzione esaustiva. Pratica questi sei pilastri dei lavori di data science e sarai sulla buona strada per sviluppare una carriera nella data science che durerà quanto vorrai. 

****[Nate Rosidi](https://twitter.com/StrataScratch)**** è un data scientist e stratega del prodotto. È anche professore a contratto che insegna analisi e è il fondatore di StrataScratch, una piattaforma che aiuta i data scientist a prepararsi per i colloqui con vere domande di intervista provenienti dalle principali aziende. Connettiti con lui su Twitter: StrataScratch o LinkedIn.