Utilizza l’apprendimento automatico senza scrivere nemmeno una riga di codice con Amazon SageMaker Canvas

Usa l'apprendimento automatico senza scrivere una sola riga di codice con Amazon SageMaker Canvas

Nel recente passato, l’utilizzo del machine learning (ML) per effettuare previsioni, soprattutto per dati sotto forma di testi e immagini, richiedeva una conoscenza approfondita del ML per la creazione e l’ottimizzazione di modelli di deep learning. Oggi, il ML è diventato accessibile a qualsiasi utente che desideri utilizzare modelli di ML per generare valore aziendale. Con Amazon SageMaker Canvas, puoi creare previsioni per diversi tipi di dati oltre a quelli tabellari o serie temporali senza scrivere neanche una riga di codice. Queste capacità includono modelli pre-addestrati per dati di immagini, testi e documenti.

In questo post, discutiamo di come puoi utilizzare modelli pre-addestrati per ottenere previsioni per tipi di dati supportati oltre ai dati tabellari.

Dati di testo

SageMaker Canvas fornisce un ambiente visuale senza codice per la creazione, l’addestramento e il rilascio di modelli di ML. Per i compiti di elaborazione del linguaggio naturale (NLP), SageMaker Canvas si integra perfettamente con Amazon Comprehend per consentirti di eseguire importanti funzionalità di NLP come il riconoscimento del linguaggio, il rilevamento delle entità, l’analisi del sentiment, il modello di argomento e altro ancora. L’integrazione elimina la necessità di codifica o ingegneria dei dati per utilizzare i robusti modelli di NLP di Amazon Comprehend. Devi semplicemente fornire i tuoi dati di testo e selezionare quattro capacità comunemente utilizzate: analisi del sentiment, rilevamento del linguaggio, estrazione delle entità e rilevamento delle informazioni personali. Per ogni scenario, puoi utilizzare l’interfaccia utente per testare e utilizzare la previsione batch per selezionare i dati archiviati in Amazon Simple Storage Service (Amazon S3).

Analisi di dati di testo su SageMaker Canvas

Analisi del sentiment

Con l’analisi del sentiment, SageMaker Canvas ti consente di analizzare il sentiment del tuo testo di input. Può determinare se il sentiment generale è positivo, negativo, misto o neutro, come mostrato nella screenshot seguente. Questo è utile in situazioni come l’analisi delle recensioni dei prodotti. Ad esempio, il testo “Adoro questo prodotto, è fantastico!” verrebbe classificato da SageMaker Canvas come con un sentiment positivo, mentre “Questo prodotto è orribile, mi pento di averlo comprato” verrebbe etichettato come sentiment negativo.

Analisi del sentiment su SageMaker Canvas

Estrazione delle entità

SageMaker Canvas può analizzare il testo e rilevare automaticamente le entità menzionate all’interno di esso. Quando un documento viene inviato a SageMaker Canvas per l’analisi, identificherà persone, organizzazioni, luoghi, date, quantità e altre entità nel testo. Questa capacità di estrazione delle entità ti consente di ottenere rapidamente informazioni sulle persone chiave, i luoghi e i dettagli discussi nei documenti. Per una lista di entità supportate, consulta Entità.

Estrazione delle entità su SageMaker Canvas

Rilevamento del linguaggio

SageMaker Canvas può anche determinare la lingua dominante del testo utilizzando Amazon Comprehend. Analizza il testo per identificare la lingua principale e fornisce punteggi di confidenza per la lingua dominante rilevata, ma non indica la suddivisione percentuale per documenti multilingue. Per ottenere i migliori risultati con documenti lunghi in più lingue, suddividi il testo in pezzi più piccoli e aggrega i risultati per stimare le percentuali di lingua. Funziona meglio con almeno 20 caratteri di testo.

Rilevazione della lingua su SageMaker Canvas

Rilevazione delle informazioni personali

Puoi anche proteggere i dati sensibili utilizzando la rilevazione delle informazioni personali con SageMaker Canvas. Può analizzare documenti di testo per rilevare automaticamente le entità di informazioni personalmente identificabili (PII), consentendoti di individuare dati sensibili come nomi, indirizzi, date di nascita, numeri di telefono, indirizzi email e altro ancora. Analizza documenti fino a 100 KB e fornisce un punteggio di fiducia per ogni entità rilevata in modo da poter esaminare e redigere selettivamente le informazioni più sensibili. Per un elenco delle entità rilevate, consulta Rilevazione delle entità PII.

Rilevazione PII su SageMaker Canvas

Dati di immagine

SageMaker Canvas fornisce un’interfaccia visuale senza codice che semplifica l’utilizzo delle capacità di visione artificiale integrandosi con Amazon Rekognition per l’analisi delle immagini. Ad esempio, puoi caricare un set di immagini, utilizzare Amazon Rekognition per rilevare oggetti e scene e eseguire la rilevazione del testo per affrontare una vasta gamma di casi d’uso. L’interfaccia visuale e l’integrazione di Amazon Rekognition rendono possibile per i non sviluppatori sfruttare avanzate tecniche di visione artificiale.

Analisi dei dati di immagine su SageMaker Canvas

Rilevazione di oggetti nelle immagini

SageMaker Canvas utilizza Amazon Rekognition per rilevare etichette (oggetti) in un’immagine. Puoi caricare l’immagine dall’interfaccia utente di SageMaker Canvas o utilizzare la scheda Predizione batch per selezionare immagini archiviate in un bucket S3. Come mostrato nell’esempio seguente, può estrarre gli oggetti nell’immagine come torre dell’orologio, autobus, edifici e altro ancora. Puoi utilizzare l’interfaccia per cercare attraverso i risultati della previsione e ordinarli.

Rilevazione di oggetti nelle immagini su SageMaker Canvas

Rilevazione del testo nelle immagini

Estrarre il testo dalle immagini è un caso d’uso molto comune. Ora puoi eseguire questa operazione facilmente su SageMaker Canvas senza codice. Il testo viene estratto come elementi di linea, come mostrato nella seguente schermata. Breve frasi all’interno dell’immagine vengono classificate insieme e identificate come una frase.

Rilevazione del testo nelle immagini su SageMaker Canvas

Puoi eseguire previsioni batch caricando un insieme di immagini, estrarre tutte le immagini in un singolo lavoro batch e scaricare i risultati come file CSV. Questa soluzione è utile quando si desidera estrarre e rilevare testi nelle immagini.

Dati del documento

SageMaker Canvas offre una varietà di soluzioni pronte all’uso che risolvono le tue esigenze quotidiane di comprensione dei documenti. Queste soluzioni sono alimentate da Amazon Textract. Per visualizzare tutte le opzioni disponibili per i documenti, scegli Modelli pronti all’uso nel riquadro di navigazione e filtra per Documenti, come mostrato nella seguente schermata.

Analisi dei dati del documento su SageMaker Canvas

Analisi del documento

L’analisi del documento analizza documenti e moduli per le relazioni tra i testi rilevati. Le operazioni restituiscono quattro categorie di estrazione dei documenti: testo grezzo, moduli, tabelle e firme. La capacità della soluzione di comprendere la struttura del documento ti offre una maggiore flessibilità nel tipo di dati che desideri estrarre dai documenti. La seguente schermata è un esempio di come appare la rilevazione delle tabelle.

Analisi del documento su SageMaker Canvas

Questa soluzione è in grado di comprendere la struttura di documenti complessi, il che è utile quando hai bisogno di estrarre informazioni specifiche nei tuoi documenti.

Analisi dei documenti di identità

Questa soluzione è progettata per analizzare documenti come carte di identità personali, patenti di guida o altre forme simili di identificazione. Informazioni come il nome di mezzo, la contea e il luogo di nascita, insieme al punteggio di precisione individuale, verranno restituite per ogni documento di identità, come mostrato nella seguente schermata.

Analisi dei documenti di identità su SageMaker Canvas

È possibile eseguire una previsione batch, caricando un insieme di documenti di identità e elaborandoli come un lavoro batch. Ciò fornisce un modo rapido e senza interruzioni per trasformare i dettagli dei documenti di identità in coppie chiave-valore che possono essere utilizzate per processi successivi come l’analisi dei dati.

Analisi delle spese

L’analisi delle spese è progettata per analizzare documenti di spesa come fatture e ricevute. La seguente schermata è un esempio di come appaiono le informazioni estratte.

Analisi delle spese su SageMaker Canvas

I risultati vengono restituiti come campi di riepilogo e campi delle voci di dettaglio. I campi di riepilogo sono coppie chiave-valore estratte dal documento e contengono chiavi come Totale generale, Data di scadenza e Tasse. I campi delle voci di dettaglio si riferiscono ai dati strutturati come una tabella nel documento. Questo è utile per estrarre informazioni dal documento mantenendo il suo layout.

Domande sui documenti

Le query sui documenti sono progettate per consentirti di fare domande sui tuoi documenti. Questa è una soluzione ottima da utilizzare quando hai documenti di più pagine e desideri estrarre risposte molto specifiche dai tuoi documenti. La seguente è un esempio dei tipi di domande che puoi fare e di come appaiono le risposte estratte.

Query sui documenti su SageMaker Canvas

La soluzione fornisce un’interfaccia semplice per interagire con i tuoi documenti. Questo è utile quando desideri ottenere dettagli specifici all’interno di documenti di grandi dimensioni.

Conclusioni

SageMaker Canvas fornisce un ambiente senza codice per utilizzare l’intelligenza artificiale in modo semplice su vari tipi di dati come testo, immagini e documenti. L’interfaccia visiva e l’integrazione con i servizi AWS come Amazon Comprehend, Amazon Rekognition e Amazon Textract eliminano la necessità di codifica e ingegneria dei dati. Puoi analizzare il testo per sentimenti, entità, lingue e informazioni identificabili personalmente (PII). Per le immagini, la rilevazione di oggetti e testo consente casi d’uso di computer vision. Infine, l’analisi dei documenti può estrarre il testo preservando il layout per i processi successivi. Le soluzioni pronte all’uso in SageMaker Canvas rendono possibile sfruttare tecniche avanzate di intelligenza artificiale per generare informazioni da dati strutturati e non strutturati. Se sei interessato all’utilizzo di strumenti senza codice con modelli di intelligenza artificiale pronti all’uso, prova SageMaker Canvas oggi stesso. Per ulteriori informazioni, consulta Guida introduttiva all’utilizzo di Amazon SageMaker Canvas.