Un progetto di Data Science con l’interprete del codice ChatGPT

Progetto Data Science con ChatGPT

Crea un progetto di data science end-to-end con l’ultimo plugin di ChatGPT.

Foto di Firmbee.com su Unsplash

Come qualcuno che al momento sta gestendo un lavoro di data science a tempo pieno con diversi progetti freelance, sono sempre il primo a provare strumenti che possono potenzialmente ridurre i tempi di consegna.

Quando ChatGPT ha iniziato a distribuire il plugin Code Interpreter agli abbonati nella scorsa settimana, non vedevo l’ora di incorporarlo nei miei progetti di data science.

Se non ne hai ancora sentito parlare, Code Interpreter è un plugin che ti consente di caricare documenti ed eseguire programmi Python all’interno dell’interfaccia di ChatGPT.

Sono passati i tempi in cui dovevamo copiare e incollare manualmente i dati in ChatGPT e aspettare una risposta.

Con Code Interpreter, puoi semplicemente caricare il tuo dataset e farlo analizzare, costruire modelli di machine learning e generare visualizzazioni in pochi minuti.

In questo articolo, ti mostrerò come Code Interpreter può essere utilizzato per eseguire un progetto di data science end-to-end.

L’incarico – Segmentazione dei clienti

Nella mia azienda precedente, ho lavorato come data scientist nel marketing.

Ciò significava che utilizzavo i dati dei clienti per aumentare le vendite – identificando i nostri utenti più redditizi, prevedendo i tassi di churn e costruendo profili delle persone da mirare nelle future campagne di marketing.

Ho persino scritto un tutorial sulla costruzione di un modello di segmentazione dei clienti con Python, in cui ho utilizzato un dataset disponibile pubblicamente per identificare quanto valore avesse ciascun cliente per un’azienda di e-commerce.

In questo articolo, eseguiremo la segmentazione dei clienti sullo stesso dataset. Tuttavia, questa volta useremo ChatGPT Code Interpreter per aiutarci a costruire il modello.

Pre-Requisiti

Per questa analisi utilizzeremo il dataset sull’e-commerce di Kaggle. Questo dataset è stato ottenuto dal Repository di Machine Learning dell’UCI e comprende informazioni sulle transazioni di vendita al dettaglio di un’azienda di e-commerce con sede nel Regno Unito.

Questo dataset è distribuito con licenza Creative Commons Attribution 4.0 International (CC BY 4.0).