Ho mostrato all’interprete del codice di ChatGPT un dataset disordinato e la versione pulita desiderata
Ho mostrato all'interprete del codice di ChatGPT un dataset disordinato e la versione pulita desiderata' Translated condensed text I showed the ChatGPT code interpreter a messy dataset and the desired clean version.
E mi sono seduto per osservare come mi ha fornito i dati che volevo.

Quando guardo un dataset grezzo e disordinato, la mia prima reazione di solito è “vorrei che fosse in questo formato”.
Poi, desidero avere una bacchetta magica che possa convertire il dataset disordinato in un formato bello e pulito.
Code Interpreter di ChatGPT è quella bacchetta magica. Beh, in realtà è ancora meglio. Code Interpreter non fa magie ma invece ti insegna come fare l’operazione desiderata con spiegazioni chiare e codice Python.
La pulizia dei dati richiede la maggior parte del tempo in un progetto tipico. Ed è noioso.
- Cosa significa innatismo e ha importanza per l’intelligenza artificiale? (Parte 2)
- Che cos’è l’innatismo e ha qualche importanza per l’intelligenza artificiale? (Parte 1)
- Verso una AI al livello di Dio da una AI al livello di cane
Non ti senti come se avessi realizzato qualcosa perché un dataset pulito non è il prodotto finale. È solo un passaggio intermedio. Tuttavia, è assolutamente necessario per i processi successivi.
Il compito
Ho chiesto a Code Interpreter di pulire un dataset. Tutto quello che dovevo fare era caricare il dataset grezzo e specificare il formato desiderato. Il resto è andato senza problemi.
In realtà avevo già pulito questo dataset da solo. Considerando il tempo e lo sforzo che ho impiegato per il compito, ciò che Code Interpreter ha fatto mi ha reso ancora più entusiasta di questo plugin e del suo potenziale.
Ho anche scritto un articolo su come l’ho pulito. Suggerisco di leggere anche quell’articolo solo per vedere quanto impressionante sia il lavoro di Code Interpreter.
Il dataset grezzo
Il dataset contiene i tassi di obesità per gli adulti in 195 paesi tra il 1975 e il 2016.
È disponibile su Kaggle con una licenza di dominio pubblico senza copyright, quindi sentiti libero di scaricarlo e usarlo. Condividerò anche il codice generato da Code Interpreter in modo che tu possa provarlo anche tu.
Ecco come appare il formato grezzo:

Sicuramente non è in un formato utilizzabile.