Utilizza il machine learning senza codice per estrarre informazioni dalle recensioni dei prodotti utilizzando l’analisi del sentiment e i modelli di analisi del testo di Amazon SageMaker Canvas’.

Utilizza il machine learning senza codice per ottenere informazioni dalle recensioni dei prodotti con Amazon SageMaker Canvas analisi del sentiment e modelli di analisi del testo

Secondo Gartner, il 85% degli acquirenti di software si fida delle recensioni online tanto quanto delle raccomandazioni personali. I clienti forniscono feedback e recensioni sui prodotti che hanno acquistato attraverso molti canali, tra cui siti di recensioni, siti di venditori, chiamate di vendita, social media e molti altri. Il problema con il crescente volume di recensioni dei clienti su più canali è che può essere difficile per le aziende elaborare ed estrarre informazioni significative dai dati utilizzando i metodi tradizionali. L’apprendimento automatico (ML) può analizzare grandi volumi di recensioni sui prodotti e identificare modelli, sentimenti e argomenti discussi. Con queste informazioni, le aziende possono ottenere una migliore comprensione delle preferenze dei clienti, dei punti critici e dei livelli di soddisfazione. Possono anche utilizzare queste informazioni per migliorare prodotti e servizi, identificare tendenze e prendere azioni strategiche che favoriscano la crescita del business. Tuttavia, l’implementazione di ML può essere una sfida per le aziende che non dispongono di risorse come esperti di ML, scienziati dei dati o sviluppatori di intelligenza artificiale (AI). Con le nuove funzionalità di Amazon SageMaker Canvas, gli analisti aziendali possono ora utilizzare ML per estrarre informazioni dalle recensioni dei prodotti.

SageMaker Canvas è progettato per le esigenze funzionali degli analisti aziendali che utilizzano AWS no code ML per l’analisi ad hoc dei dati tabulari. SageMaker Canvas è un servizio visuale che consente agli analisti aziendali di generare previsioni ML accurate senza scrivere una sola riga di codice o richiedere competenze di ML. È possibile utilizzare modelli per effettuare previsioni in modo interattivo e per scoring batch su dataset bulk. SageMaker Canvas offre soluzioni di modelli AI completamente gestiti e pronti all’uso e modelli personalizzati. Per i casi d’uso comuni di ML, è possibile utilizzare un modello AI pronto all’uso per generare previsioni con i propri dati senza alcun addestramento del modello. Per i casi d’uso di ML specifici del proprio settore aziendale, è possibile addestrare un modello ML con i propri dati per le previsioni personalizzate.

In questo post, dimostreremo come utilizzare il modello di analisi del sentiment pronto all’uso e il modello di analisi del testo personalizzato per ottenere informazioni dalle recensioni dei prodotti. In questo caso d’uso, abbiamo un insieme di recensioni sintetizzate sui prodotti che desideriamo analizzare per determinare i sentimenti e classificare le recensioni per tipo di prodotto, in modo da facilitare l’identificazione di modelli e tendenze che possano aiutare i responsabili aziendali a prendere decisioni più informate. Inizieremo descrivendo i passaggi per determinare il sentiment delle recensioni utilizzando il modello di analisi del sentiment pronto all’uso. Successivamente, vi guideremo attraverso il processo di addestramento di un modello di analisi del testo per classificare le recensioni per tipo di prodotto. Quindi, spiegheremo come valutare le prestazioni del modello addestrato. Infine, vi spiegheremo come utilizzare il modello addestrato per effettuare previsioni.

L’analisi del sentiment è un modello pronto all’uso di elaborazione del linguaggio naturale (NLP) che analizza il testo per determinare i sentimenti. L’analisi del sentiment può essere eseguita per singole righe o previsioni batch. I sentimenti previsti per ogni riga di testo possono essere positivi, negativi, misti o neutrali.

L’analisi del testo consente di classificare il testo in due o più categorie utilizzando modelli personalizzati. In questo post, vogliamo classificare le recensioni dei prodotti in base al tipo di prodotto. Per addestrare un modello personalizzato di analisi del testo, è sufficiente fornire un set di dati costituito dal testo e dalle categorie associate in un file CSV. Il set di dati richiede un minimo di due categorie e 125 righe di testo per categoria. Dopo aver addestrato il modello, è possibile valutare le prestazioni del modello e eventualmente riaddestrarlo prima di utilizzarlo per le previsioni.

Prerequisiti

Completare i seguenti prerequisiti:

  1. Avere un account AWS.
  2. Configurare SageMaker Canvas.
  3. Scaricare i dataset di recensioni di prodotti di esempio:
    • sample_product_reviews.csv – Contiene 2.000 recensioni sintetizzate di prodotti e viene utilizzato per l’analisi dei sentimenti e le previsioni di analisi del testo.
    • sample_product_reviews_training.csv – Contiene 600 recensioni sintetizzate di prodotti e tre categorie di prodotti, ed è destinato all’addestramento del modello di analisi del testo.

Analisi del sentiment

Per prima cosa, utilizzare l’analisi del sentiment per determinare i sentimenti delle recensioni dei prodotti completando i seguenti passaggi.

  1. Nella console SageMaker, fare clic su Canvas nel riquadro di navigazione, quindi fare clic su Apri Canvas per aprire l’applicazione SageMaker Canvas.
  2. Fare clic su Modelli pronti all’uso nel riquadro di navigazione, quindi fare clic su Analisi del sentiment.
  3. Fare clic su Predizione batch, quindi fare clic su Crea dataset.
  4. Fornire un Nome del dataset e fare clic su Crea.
  5. Fare clic su Seleziona file dal tuo computer per importare il dataset sample_product_reviews.csv.
  6. Fare clic su Crea dataset e verificare i dati. La prima colonna contiene le recensioni e viene utilizzata per l’analisi del sentiment. La seconda colonna contiene l’ID della recensione e viene utilizzata solo come riferimento.
  7. Fare clic su Crea dataset per completare il processo di caricamento dei dati.
  8. Nella vista Seleziona dataset per le previsioni, selezionare sample_product_reviews.csv e quindi fare clic su Genera previsioni.
  9. Quando la previsione batch è completa, fare clic su Visualizza per visualizzare le previsioni.
Passaggi di analisi del sentiment

Le colonne Sentiment e Confidence forniscono rispettivamente il sentiment e il punteggio di fiducia. Un punteggio di fiducia è un valore statistico compreso tra 0 e 100%, che mostra la probabilità che il sentiment sia previsto correttamente.

  1. Fare clic su Scarica CSV per scaricare i risultati sul tuo computer.

Analisi del testo

In questa sezione, verranno descritti i passaggi per eseguire l’analisi del testo con un modello personalizzato: importare i dati, addestrare il modello e quindi effettuare previsioni.

Importa i dati

Importa prima il dataset di addestramento. Seguire i seguenti passaggi:

  1. Nella pagina Modelli pronti all’uso, fare clic su Crea un modello personalizzato
  2. Per Nome del modello, inserire un nome (ad esempio, Analisi delle recensioni di prodotti). Fare clic su Analisi del testo, quindi fare clic su Crea.
  3. Nella scheda Seleziona, fare clic su Crea dataset per importare il dataset sample_product_reviews_training.csv.
  4. Fornire un Nome del dataset e fare clic su Crea.
  5. Fare clic su Crea dataset e verificare i dati. Il dataset di addestramento contiene una terza colonna che descrive la categoria del prodotto, la colonna target composta da tre prodotti: libri, video e musica.
  6. Fare clic su Crea dataset per completare il processo di caricamento dei dati.
  7. <li+nella Seleziona dataset, selezionare sample_product_reviews_training.csv e fare clic su Seleziona dataset.

Passaggi di classificazione

Addestra il modello

Successivamente, configurare il modello per avviare il processo di addestramento.

    <li+nella Costruisci, nel menu a discesa Colonna target, fare clic su product_category come obiettivo di addestramento.

  1. Fare clic su product_review come origine.
  2. Fare clic su Costruzione rapida per avviare l’addestramento del modello.

Per ulteriori informazioni sulle differenze tra Quick build e Standard build, consulta Costruire un modello personalizzato.

Dopo aver completato l’addestramento del modello, puoi valutarne le prestazioni prima di utilizzarlo per le previsioni.

  1. Sulla scheda Analizza, verrà visualizzato il punteggio di fiducia del modello. Un punteggio di fiducia indica quanto sia sicuro il modello che le sue previsioni siano corrette. Sulla scheda Informazioni generali, valuta le prestazioni per ogni categoria.
  2. Fai clic su Classificazione per visualizzare le informazioni sull’accuratezza del modello.
  3. Fai clic su Metriche avanzate per visualizzare la matrice di confusione e il punteggio F1.

Effettua previsioni

Per effettuare una previsione con il tuo modello personalizzato, segui i seguenti passaggi:

  1. Sulla scheda Prevedi, fai clic su Previsione batch, quindi fai clic su Manuale.
  2. Fai clic sullo stesso dataset, sample_product_reviews.csv, che hai utilizzato in precedenza per l’analisi del sentimento, quindi fai clic su Genera previsioni.
  3. Dopo aver completato la previsione batch, fai clic su Visualizza per visualizzare le previsioni.

Per la previsione del modello personalizzato, SageMaker Canvas impiega del tempo per distribuire il modello per l’uso iniziale. SageMaker Canvas de-provisiona automaticamente il modello se rimane inattivo per 15 minuti per risparmiare costi.

Le colonne Predizione (Categoria) e Fiducia forniscono le categorie di prodotto previste e i rispettivi punteggi di fiducia.

  1. Evidenzia il lavoro completato, seleziona i tre puntini e fai clic su Scarica per scaricare i risultati sul tuo computer.

Ripulisci

Fai clic su Disconnetti nel riquadro di navigazione per uscire dall’applicazione SageMaker Canvas e interrompere il consumo di Ore di sessione di Canvas e rilasciare tutte le risorse.

Conclusioni

In questo post, abbiamo dimostrato come è possibile utilizzare Amazon SageMaker Canvas per ottenere informazioni dalle recensioni dei prodotti senza competenze di apprendimento automatico. Inizialmente, hai utilizzato un modello di analisi del sentimento pronto all’uso per determinare i sentimenti delle recensioni dei prodotti. Successivamente, hai utilizzato l’analisi del testo per addestrare un modello personalizzato con il processo di creazione rapida. Infine, hai utilizzato il modello addestrato per categorizzare le recensioni dei prodotti in categorie di prodotti. Tutto questo senza scrivere una singola riga di codice. Consigliamo di ripetere il processo di analisi del testo con il processo di creazione standard per confrontare i risultati del modello e la fiducia nelle previsioni.