Ho testato ChatGPT ADA per un compito di pulizia dei dati. È molto utile ma fallisce nella ragionamento logico

Ho provato ChatGPT ADA per un lavoro di pulizia dei dati. È estremamente utile, ma manca nella capacità di ragionamento logico

Vediamo quanto può essere buono e cattivo

(immagine creata dall'autore con Midjourney)

Una grande parte dei lavori legati ai dati consiste nella pulizia dei dati. Di solito non c’è un modo standard per pulire i dati, poiché possono presentarsi in numerose forme diverse.

Incontriamo inconsistenze, errori di inserimento dei dati e molti altri tipi di problemi che devono essere gestiti prima che i dati possano essere utilizzati per processi successivi.

Ho testato il plugin ChatGPT Advanced Data Analysis (ADA) per un compito di pulizia dei dati che coinvolge un dataset automobilistico.

TL;DR ChatGPT ADA è estremamente utile nell’utilizzo di librerie di pulizia dei dati per compiti richiesti, ma non riesce a capire cosa fare in alcuni casi.

In realtà ho pulito il dataset da solo in precedenza. Ora voglio vedere come il plugin ChatGPT ADA si avvicinerà al compito e lo pulirà. Condividerò il mio codice e quello di ChatGPT in modo che tu possa confrontare.

Per poter utilizzare ADA, è necessario attivarlo nelle funzioni beta nelle impostazioni. Quindi, una volta avviata una nuova chat, fai clic su ADA prima di scrivere qualsiasi istruzione.

Come attivare ADA (immagine dell'autore)

Il passaggio successivo è caricare il dataset nella chat, cosa che può essere fatta utilizzando il simbolo “+” accanto alla finestra del prompt.

Come caricare un dataset nella chat (immagine dell'autore)

Ecco le prime 5 righe del dataset:

(immagine dell'autore)

Ho creato il dataset con dati simulati. Tuttavia, è simile a un dataset di automobili che si potrebbe recuperare dal web. Lo so perché l’ho fatto in precedenza. Puoi scaricare il dataset dal mio repository datasets se vuoi testare questo plugin da solo. Si chiama “mock_car_dataset”.

Sollecitare

Innanzitutto ho fatto a ChatGPT una domanda generale:

Io: Raccontami di questo dataset