Ho mostrato all’interprete del codice di ChatGPT un dataset disordinato e la versione pulita desiderata

Ho mostrato all'interprete del codice di ChatGPT un dataset disordinato e la versione pulita desiderata' Translated condensed text I showed the ChatGPT code interpreter a messy dataset and the desired clean version.

E mi sono seduto per osservare come mi ha fornito i dati che volevo.

Foto di JESHOOTS.COM su Unsplash

Quando guardo un dataset grezzo e disordinato, la mia prima reazione di solito è “vorrei che fosse in questo formato”.

Poi, desidero avere una bacchetta magica che possa convertire il dataset disordinato in un formato bello e pulito.

Code Interpreter di ChatGPT è quella bacchetta magica. Beh, in realtà è ancora meglio. Code Interpreter non fa magie ma invece ti insegna come fare l’operazione desiderata con spiegazioni chiare e codice Python.

La pulizia dei dati richiede la maggior parte del tempo in un progetto tipico. Ed è noioso.

Non ti senti come se avessi realizzato qualcosa perché un dataset pulito non è il prodotto finale. È solo un passaggio intermedio. Tuttavia, è assolutamente necessario per i processi successivi.

Il compito

Ho chiesto a Code Interpreter di pulire un dataset. Tutto quello che dovevo fare era caricare il dataset grezzo e specificare il formato desiderato. Il resto è andato senza problemi.

In realtà avevo già pulito questo dataset da solo. Considerando il tempo e lo sforzo che ho impiegato per il compito, ciò che Code Interpreter ha fatto mi ha reso ancora più entusiasta di questo plugin e del suo potenziale.

Ho anche scritto un articolo su come l’ho pulito. Suggerisco di leggere anche quell’articolo solo per vedere quanto impressionante sia il lavoro di Code Interpreter.

Il dataset grezzo

Il dataset contiene i tassi di obesità per gli adulti in 195 paesi tra il 1975 e il 2016.

È disponibile su Kaggle con una licenza di dominio pubblico senza copyright, quindi sentiti libero di scaricarlo e usarlo. Condividerò anche il codice generato da Code Interpreter in modo che tu possa provarlo anche tu.

Ecco come appare il formato grezzo:

Dataset grezzo (immagine dell'autore)

Sicuramente non è in un formato utilizzabile.

Il promemoria