Prime sessioni e relatori annunciati per ODSC West 2023
Announced sessions and speakers for ODSC West 2023
ODSC West potrebbe essere ancora a diversi mesi di distanza, ma abbiamo già organizzato interessanti talk, workshop e sessioni di formazione da parte di alcuni dei principali esperti di intelligenza artificiale e data science. Scopriteli qui di seguito.
Guidare il successo per i venditori attraverso l’integrazione dell’IA nella piattaforma CRM
Sarah Kefayati|Data Scientist Principale Associato|IBM
- Le emoji stanno diventando sempre più vincolanti dal punto di vista legale. Ma sono ancora aperte a un’ampia interpretazione.
- Può l’A.I. inventare?
- L’A.I. ha scritto un disegno di legge sulle abitazioni. I critici dicono che non sia intelligente
In questa sessione esploreremo come gli algoritmi di intelligenza artificiale possono generare migliori raccomandazioni analizzando le preferenze, il comportamento e la cronologia degli acquisti dei clienti. Esamineremo anche l’architettura e i componenti di design che consentono di integrare le raccomandazioni personalizzate nella nostra piattaforma CRM.
MLOps: Monitoraggio e gestione della deriva
Oliver Zeigermann|Architetto di Machine Learning|Freelancer
Questo workshop discuterà le metriche che possono essere utilizzate come sostituti per comprendere le prestazioni del tuo modello. Nella Parte 1 di questa sessione, imparerai a:
- Simulare la produzione su un modello di machine learning esistente e rilevare la deriva
- Utilizzare il servizio di machine learning OpenAPI
- Utilizzeremo Evidently, Prometheus e Grafana per monitorare e rilevare la deriva
La Parte II tratterà:
- Interpretare e analizzare la deriva e decidere cosa fare al riguardo
- Capire cosa ha causato la deriva e decidere cosa fare al riguardo
- Potrai ad esempio riallenare il tuo modello con nuovi dati
- Considerare di ripensare l’architettura del modello o i dati che stiamo utilizzando
Catturare CAP in un’architettura dati di tipo Kappa
Joep Kokkeler|Ingegnere Senior dei Dati|Dataworkz NL
Il teorema CAP afferma che non è possibile avere contemporaneamente coerenza, disponibilità e tolleranza alle partizioni, ma cosa succederebbe se scegliessimo un’architettura Kappa che rendesse possibile averle tutte e tre? Questa sessione discuterà cosa è Kappa e come si confronta con Lambda, un’architettura microservizi e monolitica.
Un sistema di rilevamento anomalo semi-supervisionato tramite algoritmo di stacking dell’ensemble
Chuying Ma|Data Scientist Senior|Walmart
In questa sessione esploreremo un’architettura di rilevamento anomalo sistematica, flessibile, estensibile e olistica per aumentare le etichette esistenti e rilevare anomalie a basso costo. Il nuovo sistema è in grado di incorporare sia modelli di machine learning tradizionali che modelli di rilevamento delle anomalie basati sull’apprendimento profondo per generare un punteggio di anomalia unificato mediante l’algoritmo di stacking dell’ensemble per affrontare contemporaneamente diversi tipi di anomalie.
Personalizzare LLMs con un Feature Store
Jim Dowling|CEO|Hopsworks
In questa sessione imparerai come personalizzare LLMs utilizzando un feature store e l’ingegneria delle prompt. Vedrai come il feature store open-source Hopsworks può essere utilizzato per costruire un’applicazione LLM personalizzata. In particolare, analizzerai:
- Come creare modelli per le prompt e come possono essere facilmente costruiti e inclusi nelle query degli utenti
- Come popolare i modelli per le prompt con dati di contesto in tempo reale, prodotti da pipeline di feature in streaming, e dati specifici dell’utente, prodotti da pipeline di feature batch
- Come possiamo incorporare documenti da database vettoriali nelle prompt utilizzando una combinazione di input dell’utente e dati storici dell’utente dal feature store
Cosa è un database di serie temporali e perché ne ho bisogno?
Jeff Tao|Fondatore e CEO|TDengine
La crescita delle dimensioni dei set di dati di serie temporali rappresenta una sfida importante per i sistemi di gestione di database generali come i database relazionali e NoSQL. Questa sessione coprirà i database di serie temporali appositamente progettati, una soluzione a questa sfida. Sono molto più efficienti in termini di velocità di inserimento, latenza delle query e compressione dei dati. Includono anche funzioni analitiche speciali e funzionalità di gestione dei dati in modo da poter sviluppare applicazioni in modo più semplice.
Tecniche di valutazione per modelli di linguaggio di grandi dimensioni
Rajiv Shah, PhD|Ingegnere di Machine Learning|Hugging Face
In questa sessione, imparerai sulla ricerca esistente sulle capacità dei LLM in confronto ai modelli tradizionali di ML più piccoli. Discuterai anche se un LLM è la soluzione migliore e diverse tecniche, inclusi set di valutazione come EleutherAI Harness, approcci di competizione diretta e l’utilizzo di LLM per valutare altri LLM. Il tutorial toccherà anche fattori sottili che influenzano la valutazione, inclusi il ruolo degli input, la tokenizzazione e i requisiti per l’accuratezza dei fatti. Infine, una discussione sul bias dei modelli e l’etica sarà integrata negli esempi pratici.
Data Science Applicata ai Problemi di Produzione
Angad Arora|Data Scientist di Produzione|Google
Questa sessione discuterà come la data science può aiutare a raggiungere 3 KPI (Indicatori chiave di prestazione) nella produzione: produrre di più, essere efficienti e ottimizzare l’utilizzo delle risorse e spedire con la massima qualità possibile. Approfondirai esempi di progetti chiave che hanno influenzato questi KPI.
Cosa succederà dopo?
Unisciti a noi a ODSC West 2023 questo novembre per saperne di più su questi argomenti e molto altro. Inoltre, risparmierai il 70% sul tuo biglietto in presenza o virtuale come parte del nostro Super Early Bird Sale se ti registri entro venerdì.