Suggerimenti e trucchi per utilizzare prompt Engineering per un compito di classificazione del testo.

Suggerimenti e trucchi per utilizzare al meglio Prompt Engineering per un compito di classificazione del testo.

Perché perfezionare un modello per un compito di classificazione del testo, quando l’ingegneria delle istruzioni svolge il lavoro giusto? Ho recentemente capito che l’adattamento di un LLM potrebbe risolvere il problema, naturalmente a costo di qualche soldo, ma non è l’unica soluzione quando abbiamo la nostra salvatrice ingegneria delle istruzioni. Stavo lavorando su un compito di classificazione del testo. Inizialmente, ho iniziato con le istruzioni ma in qualche modo ho avuto l’impressione che non funzionassero bene, date le sfide della classificazione. Stavo per adattare un LLM, ma ho fatto una pausa per fare qualche altro esperimento con le istruzioni, il che è stato sicuramente utile. In questo articolo, cercherò di spiegare alcuni suggerimenti e trucchi che possono essere utilizzati durante l’utilizzo di istruzioni per un LLM per un problema di classificazione del testo.

Prima di tutto, partiamo dalle sfide che incontriamo con un problema di classificazione tipico e vediamo come le istruzioni possono aiutarci a risolverle, poi concentriamoci anche su alcuni suggerimenti per le istruzioni.

1. Dati disordinati? Allora puliscili.

Non importa quale sia il problema, i dati sono la chiave. Segui una linea simile, assicurati che i dati siano puliti, anche se è noto che i LLM possono comprendere il linguaggio naturale, è sempre una buona pratica analizzare i dati e rimuovere eventuali caratteri o stringhe indesiderate che pensi non aggiungeranno alcun valore alla classificazione. Questo pulirà quindi non solo i dati ma ridurrà anche il numero di token inviati al LLM, riducendo così i costi.

2. Raffina i nomi delle classi.

Dedica del tempo a rivedere e raffinare i vari nomi delle classi (o dei nomi delle categorie) in cui il testo deve essere classificato. Assicurati che i nomi delle classi raffinati siano significativi, comprensibili ed esplicativi. Ad esempio, se un nome di classe è “Casa che piace” (che è poco descrittivo) che rappresenta un insieme di testi in cui un cliente apprezza le case mostrate da un’agenzia immobiliare, rinomina la classe come “Clienti che apprezzano le case mostrate”. In questo modo, i LLM possono facilmente selezionare la classe corretta e assegnarla al testo. Tuttavia, è sempre possibile ripristinare i nomi delle classi originali una volta completata la classificazione memorizzando i nomi delle classi originali e i nomi delle classi raffinate in un dizionario principale. Questa tecnica migliorerà sicuramente la precisione.

3. Affronta le classi strettamente correlate per evitare la classificazione errata.

E ora, cosa fare se hai due categorie o classi strettamente correlate, ad esempio “Casa che piace” e “Feedback positivi del cliente”. Qui è più…