Accelerare i risultati aziendali con miglioramenti del 70% delle prestazioni nel processo dei dati, nell’addestramento e nell’inferenza con Amazon SageMaker Canvas

Migliora i risultati aziendali del 70% con Amazon SageMaker Canvas

Amazon SageMaker Canvas è un’interfaccia visuale che consente agli analisti aziendali di generare previsioni di apprendimento automatico (ML) precise da soli, senza richiedere alcuna esperienza di ML o la scrittura di una singola riga di codice. L’interfaccia utente intuitiva di SageMaker Canvas consente agli analisti aziendali di sfogliare e accedere a fonti di dati diverse nel cloud o in locale, preparare ed esplorare i dati, creare e addestrare modelli di ML e generare previsioni accurate all’interno di un singolo spazio di lavoro.

SageMaker Canvas consente agli analisti di utilizzare diversi carichi di lavoro dei dati per raggiungere gli obiettivi aziendali desiderati con elevata precisione e performance. I requisiti di calcolo, archiviazione e memoria per generare previsioni accurate sono astratti dall’utente finale, consentendogli di concentrarsi sul problema aziendale da risolvere. All’inizio di quest’anno, abbiamo annunciato ottimizzazioni delle prestazioni basate sul feedback dei clienti per offrire tempi di addestramento del modello più rapidi e accurati con SageMaker Canvas.

In questo post, mostriamo come SageMaker Canvas può ora elaborare dati, addestrare modelli e generare previsioni con maggiore velocità ed efficienza per diverse dimensioni di set di dati.

Prerequisiti

Se desideri seguire, completa i seguenti prerequisiti:

  1. Avere un account AWS.
  2. Configurare SageMaker Canvas. Per istruzioni, consulta i prerequisiti per la configurazione di Amazon SageMaker Canvas.
  3. Scarica i seguenti due set di dati sul tuo computer locale. Il primo è il set di dati sui viaggi in taxi gialli di NYC; il secondo è il set di dati sul comportamento di eCommerce relativo agli eventi di vendita al dettaglio relativi a prodotti e utenti.

Entrambi i set di dati sono coperti dalla licenza Attribution 4.0 International (CC BY 4.0) e sono liberamente condivisibili e adattabili.

Miglioramenti nell’elaborazione dei dati

Grazie alle ottimizzazioni delle prestazioni sottostanti, il tempo di importazione dei dati in SageMaker Canvas è migliorato di oltre il 70%. Ora è possibile importare set di dati fino a 2 GB in circa 50 secondi e fino a 5 GB in circa 65 secondi.

Dopo l’importazione dei dati, gli analisti aziendali di solito convalidano i dati per assicurarsi che non ci siano problemi all’interno del set di dati. Alcuni esempi di controlli di convalida possono essere garantire che le colonne contengano il tipo di dati corretto, verificare se gli intervalli di valore siano in linea con le aspettative, assicurarsi che ci sia unicità nei valori, quando applicabile, e altri.

La convalida dei dati è ora più veloce. Nei nostri test, tutte le convalide hanno richiesto 50 secondi per il set di dati dei taxi di dimensioni superiori a 5 GB, un miglioramento di velocità di 10 volte.

Miglioramenti nell’addestramento del modello

Gli ottimizzazioni delle prestazioni relative all’addestramento del modello di ML in SageMaker Canvas ti consentono ora di addestrare modelli senza incorrere in potenziali errori di richieste di memoria esaurita.

Lo screenshot seguente mostra i risultati di un’esecuzione di costruzione riuscita utilizzando un grande set di dati sull’impatto della caratteristica total_amount sulla variabile target.

Miglioramenti dell’inferenza

Infine, i miglioramenti dell’inferenza di SageMaker Canvas hanno ottenuto una riduzione del consumo di memoria di 3,5 volte in caso di set di dati più grandi nei nostri test interni.

Conclusione

In questo post, abbiamo visto vari miglioramenti con SageMaker Canvas nell’importazione, convalida, addestramento e inferenza dei dati. Abbiamo visto un aumento della capacità di importare grandi set di dati del 70%. Abbiamo visto un miglioramento di 10 volte nella convalida dei dati e una riduzione del consumo di memoria del 3,5 volte. Questi miglioramenti ti consentono di lavorare meglio con grandi set di dati e ridurre il tempo di costruzione di modelli di ML con SageMaker Canvas.

Ti incoraggiamo a sperimentare i miglioramenti tu stesso. Accogliamo con favore il tuo feedback mentre lavoriamo continuamente alle ottimizzazioni delle prestazioni per migliorare l’esperienza dell’utente.