5 Progetti di Portfolio per Studenti di Scienze dei Dati all’Ultimo Anno

5 Progetti Portfolio per Studenti di Scienze dei Dati Ultimo Anno

 

Costruire un portfolio di progetti di data science è un passo cruciale per i principianti che cercano di entrare nel campo. Con l’esperienza pratica che sta diventando sempre più importante per i candidati ai lavori di data science, avere un portfolio variegato che mostri le tue competenze può aiutarti a distinguerti.

Oltre a dimostrare le competenze tecniche, i progetti ti permettono di mettere in evidenza le tue capacità di risoluzione dei problemi e di pensiero analitico. I reclutatori cercano spesso candidati che siano in grado di utilizzare i dati per fornire informazioni strategiche per il business e costruire soluzioni basate sui dati per problemi del mondo reale. I progetti ben eseguiti possono farti distinguere come qualcuno pronto ad aggiungere valore a un’organizzazione.

In questo blog, esploreremo semplici progetti di portfolio che vanno dall’analisi dei dati all’apprendimento automatico. Scoprirai come pulire e elaborare i tuoi dati, seguiti dall’utilizzo di diverse tecniche analitiche per comunicare le informazioni a stakeholder non tecnici.

 

1. Progetto di data science end-to-end con ChatGPT

 

Nel progetto di data science end-to-end con ChatGPT, userai ChatGPT per la pianificazione del progetto, l’analisi dei dati, la pre-elaborazione dei dati, la selezione del modello, l’ottimizzazione degli iperparametri, lo sviluppo di un’app web e il suo deploy su Spaces.

Oggi, chiunque con conoscenze limitate può utilizzare ChatGPT per comprendere i dati e costruire applicazioni di apprendimento automatico. Questo progetto mostrerà che puoi lavorare con le ultime tecnologie dell’IA per produrre risultati rapidi ed efficaci.

 

 

2. Energia riciclata salvata a Singapore

 

Per il progetto Energia riciclata salvata a Singapore, userai le statistiche sul riciclaggio per determinare la quantità di energia salvata annualmente dal 2003 al 2020 per cinque diversi tipi di rifiuti: plastica, carta, vetro, metallo ferroso e metallo non ferroso. In particolare, caricherai e organizzerai il dataset, unirai diversi file CSV ed effettuerai un’analisi esplorativa dei dati. Questo progetto metterà alla prova le tue capacità di analisi e manipolazione dei dati.

 

 

3. Analisi del mercato azionario

 

Il progetto di analisi del mercato azionario utilizza dati finanziari del mondo reale per dimostrare competenze nell’analisi delle serie temporali. Dopo aver pulito i dati, viene eseguita un’analisi esplorativa e una visualizzazione utilizzando Matplotlib e Seaborn per analizzare le metriche di rischio e le relazioni tra le azioni.

Viene quindi addestrato un modello di memoria a lungo termine (LSTM) sui dati delle serie temporali per prevedere i prezzi futuri. Racchiudendo la raccolta, la pulizia, la visualizzazione e la modellazione dei dati di mercato azionario, questo progetto mette in evidenza la competenza nelle analisi dei dati e nei flussi di lavoro dell’apprendimento automatico.

 

 

4. Analisi e previsione dell’engagement dei consumatori

 

Nel progetto di analisi e previsione dell’engagement dei consumatori, utilizzerai il dataset “Internet News and Consumer Engagement” di Kaggle per prevedere l’articolo più popolare e il suo punteggio di popolarità. Analizzerai i dati per trovare modelli, come la correlazione, la distribuzione, la media e l’analisi delle serie temporali. Utilizzerai modelli di regressione e classificazione del testo per prevedere il punteggio di engagement e l’articolo migliore in base al titolo.

In questo progetto, imparerai come gestire i dati testuali, eseguire analisi testuali utilizzando librerie Python, convertire il testo in vettori e costruire un modello di classificazione LGBM.

 

 

5. Evoluzione dell’apprendimento digitale durante COVID-19

 

Nel progetto sull’evoluzione dell’apprendimento digitale durante COVID-19, utilizzeremo strumenti di analisi dei dati per individuare le tendenze nell’apprendimento digitale e come sia efficace per le comunità in via di sviluppo. Confronteremo distretti e stati su fattori come demografia, accesso a internet, accesso a prodotti per l’apprendimento e finanza. Alla fine, riassumeremo il nostro rapporto e indicheremo le aree che necessitano di maggiore attenzione per rendere l’istruzione accessibile a tutti gli studenti negli Stati Uniti.

Imparerai ad utilizzare tutti gli strumenti principali per l’analisi dei dati e la visualizzazione. È anche una guida per coloro che vogliono diventare creativi nella generazione di visualizzazioni accattivanti per le loro presentazioni.

 

 

Conclusione

 

Creare un portfolio di progetti di data science consente ai principianti di dimostrare le proprie competenze tecniche e capacità di risoluzione dei problemi ai potenziali datori di lavoro. Mostrando competenza nella raccolta, pulizia, analisi, modellazione e visualizzazione dei dati, questi progetti possono evidenziare la competenza di una persona nel flusso di lavoro della data science.

In questo blog, abbiamo esaminato cinque progetti di portfolio per studenti di data science dell’ultimo anno. Copre l’elaborazione, la manipolazione, la visualizzazione e i concetti di modellazione dei dati. Per esplorare altri progetti, controlla La Collezione Completa di Progetti di Data Science – Parte 1 e Parte 2.     Abid Ali Awan (@1abidaliawan) è un professionista certificato di data science che ama creare modelli di machine learning. Attualmente, si sta concentrando sulla creazione di contenuti e sulla scrittura di blog tecnici sulle tecnologie di machine learning e data science. Abid ha conseguito una laurea magistrale in Technology Management e una laurea triennale in Ingegneria delle Telecomunicazioni. La sua visione è quella di sviluppare un prodotto di intelligenza artificiale utilizzando una rete neurale grafica per gli studenti che lottano con disturbi mentali.