SambaSafety automatizza il carico di lavoro personalizzato R, migliorando la sicurezza dei conducenti con Amazon SageMaker e AWS Step Functions.

SambaSafety automatizza il lavoro personalizzato R per migliorare la sicurezza dei conducenti con Amazon SageMaker e AWS Step Functions.

Presso SambaSafety, la loro missione è promuovere comunità più sicure riducendo i rischi attraverso le informazioni dei dati. Dal 1998, SambaSafety è stato il principale fornitore nordamericano di software basati su cloud per la gestione del rischio di mobilità per organizzazioni con autisti commerciali e non commerciali. SambaSafety serve più di 15.000 datori di lavoro e compagnie assicurative globali con il monitoraggio del rischio e della conformità degli autisti, la formazione online e l’analisi approfondita del rischio, nonché soluzioni di prezzo del rischio. Attraverso la raccolta, la correlazione e l’analisi dei dati sui conducenti, della telematica, delle aziende e di altri sensori, SambaSafety non solo aiuta i datori di lavoro a far rispettare meglio le politiche di sicurezza e a ridurre le richieste di risarcimento, ma aiuta anche le compagnie assicurative a prendere decisioni informate di sottoscrizione e i verificatori di antecedenti a effettuare controlli precari di pre-assunzione accurati ed efficienti.

Non tutti gli autisti presentano lo stesso profilo di rischio. Più tempo si trascorre alla guida, più alto è il profilo di rischio. Il team di scienziati dei dati di SambaSafety ha sviluppato soluzioni di modellizzazione complesse e proprietarie progettate per quantificare accuratamente questo profilo di rischio. Tuttavia, hanno cercato supporto per implementare questa soluzione per batch e inferenza in tempo reale in modo coerente e affidabile.

In questo post, discutiamo come SambaSafety ha utilizzato gli strumenti di machine learning (ML) e di integrazione e distribuzione continua (CI/CD) di AWS per implementare la loro applicazione esistente di scienze dei dati per l’inferenza batch. SambaSafety ha collaborato con Firemind, un partner di consulenza avanzato AWS, per fornire una soluzione che utilizzava AWS CodeStar, AWS Step Functions e Amazon SageMaker per questo carico di lavoro. Con i prodotti AWS CI/CD e AI/ML, il team di scienze dei dati di SambaSafety non ha dovuto modificare il loro flusso di lavoro di sviluppo esistente per sfruttare la formazione continua del modello e l’inferenza.

Caso d’uso del cliente

Il team di scienze dei dati di SambaSafety aveva da tempo utilizzato il potere dei dati per informare la loro attività. Avevano diversi ingegneri e scienziati competenti che costruivano modelli interessanti che miglioravano la qualità dell’analisi del rischio sulla loro piattaforma. Le sfide affrontate da questo team non erano legate alla scienza dei dati. Il team di scienze dei dati di SambaSafety aveva bisogno di aiuto per collegare il loro flusso di lavoro esistente di scienze dei dati a una soluzione di distribuzione continua.

Il team di scienze dei dati di SambaSafety ha mantenuto diversi artefatti di tipo script come parte del loro flusso di lavoro di sviluppo. Questi script eseguivano diverse attività, tra cui la pre-elaborazione dei dati, l’ingegneria delle caratteristiche, la creazione del modello, la messa a punto del modello e la validazione e comparazione del modello. Questi script venivano tutti eseguiti manualmente quando arrivavano nuovi dati nel loro ambiente per la formazione. Inoltre, questi script non eseguivano alcuna versione del modello o ospitaggio per l’inferenza. Il team di scienze dei dati di SambaSafety aveva sviluppato soluzioni manuali per promuovere nuovi modelli in produzione, ma questo processo diventava lento e intensivo dal punto di vista del lavoro.

Per liberare il team altamente specializzato di scienze dei dati di SambaSafety per innovare su nuovi carichi di lavoro di ML, SambaSafety doveva automatizzare i compiti manuali associati alla manutenzione dei modelli esistenti. Inoltre, la soluzione doveva replicare il flusso di lavoro manuale utilizzato dal team di scienze dei dati di SambaSafety e prendere decisioni in base ai risultati di questi script. Infine, la soluzione doveva integrarsi con la loro base di codice esistente. Il team di scienze dei dati di SambaSafety ha utilizzato una soluzione di repository di codice esterno ad AWS; la pipeline finale doveva essere sufficientemente intelligente da attivarsi in base agli aggiornamenti del loro codice, scritto principalmente in R.

Panoramica della soluzione

Il diagramma seguente illustra l’architettura della soluzione, che è stata informata da una delle molte architetture open source mantenute dal partner di distribuzione di SambaSafety, Firemind.

La soluzione fornita da Firemind per il team di scienze dei dati di SambaSafety è stata costruita intorno a due pipeline di ML. La prima pipeline di ML addestra un modello utilizzando la pre-elaborazione personalizzata, gli script di formazione e di test di SambaSafety. L’artefatto del modello risultante viene distribuito per l’inferenza batch e in tempo reale ai punti finali del modello gestiti da SageMaker. La seconda pipeline di ML facilita la richiesta di inferenza per il modello ospitato. In questo modo, la pipeline per la formazione è disaccoppiata dalla pipeline per l’inferenza.

Una delle complessità di questo progetto è replicare i passaggi manuali intrapresi dagli scienziati dei dati di SambaSafety. Il team di Firemind ha utilizzato Step Functions e SageMaker Processing per completare questa attività. Step Functions consente di eseguire attività discrete in AWS utilizzando funzioni Lambda di AWS, lavoratori di Amazon Elastic Kubernetes Service (Amazon EKS) o in questo caso SageMaker. SageMaker Processing consente di definire lavori che vengono eseguiti su istanze ML gestite all’interno dell’ecosistema di SageMaker. Ogni esecuzione di un lavoro di Step Function mantiene i propri registri, la cronologia dell’esecuzione e i dettagli sul successo o il fallimento del lavoro.

Il team ha utilizzato Step Functions e SageMaker, insieme a Lambda, per gestire l’automazione dei carichi di lavoro di formazione, messa a punto, distribuzione e inferenza. L’unico elemento rimanente era l’integrazione continua delle modifiche al codice in questa pipeline di distribuzione. Firemind ha implementato un progetto CodeStar che manteneva una connessione al repository di codice esistente di SambaSafety. Quando il laborioso team di scienze dei dati di SambaSafety pubblica un aggiornamento su un ramo specifico della loro base di codice, CodeStar rileva le modifiche e attiva l’automazione.

Conclusione

Il nuovo pipeline MLOps senza server di SambaSafety ha avuto un impatto significativo sulla loro capacità di consegna. L’integrazione della scienza dei dati e dello sviluppo software consente ai loro team di lavorare insieme senza soluzione di continuità. La loro soluzione di distribuzione automatica del modello ha ridotto il tempo di consegna fino al 70%.

SambaSafety ha anche dichiarato quanto segue:

“Automatizzando i nostri modelli di scienza dei dati e integrandoli nel ciclo di vita dello sviluppo software, siamo stati in grado di raggiungere un nuovo livello di efficienza e precisione nei nostri servizi. Questo ci ha permesso di rimanere avanti rispetto alla concorrenza e di fornire soluzioni innovative ai clienti. I nostri clienti beneficeranno notevolmente di questo, con tempi di consegna più rapidi e precisione migliorata delle nostre soluzioni.”

SambaSafety si è collegato con i team degli account AWS per il loro problema. I team di architettura delle soluzioni e degli account AWS hanno lavorato per identificare questa soluzione, attingendo dalla nostra robusta rete di partner. Collegati al tuo team di account AWS per identificare opportunità trasformative simili per la tua attività.