11 modi per fare Machine Learning in modo migliore a ODSC West 2023

11 modi per migliorare l'applicazione del Machine Learning al ODSC West 2023

Molte aziende stanno ora utilizzando la scienza dei dati e l’apprendimento automatico, ma c’è ancora molto spazio per migliorare in termini di ROI. Un’analisi di VentureBeat del 2021 suggerisce che l’87% dei modelli AI non arriva mai in un ambiente di produzione e un articolo del MIT Sloan Management Review ha scoperto che il 70% delle aziende ha segnalato un impatto minimo dai progetti di AI. Tuttavia, nonostante queste difficoltà, Gartner prevede che gli investimenti nell’intelligenza artificiale raggiungeranno un livello senza precedenti di 62,5 miliardi di dollari nel 2022, con un aumento del 21,3% rispetto al 2021.

Tuttavia, rimaniamo ancora con la domanda: come possiamo fare l’apprendimento automatico in modo migliore? Per scoprirlo, abbiamo preso alcuni dei tutorial e dei workshop in programma all’ODSC West 2023 e lasciato che gli esperti, attraverso i loro argomenti, ci guidino verso la costruzione di un migliore apprendimento automatico.

Introduzione all’etichettatura dei dati

Chris Hoge | Capo della Comunità | Heartex

Nell’era moderna dell’apprendimento automatico, l’importanza dei dati di alta qualità e accuratamente etichettati non può essere sottovalutata. Questa presentazione illustra come creare set di dati di alta qualità annotati per l’addestramento di modelli di apprendimento automatico. In questo tutorial, utilizzeremo Label Studio, uno strumento di etichettatura dei dati open source e multitype, per esplorare metodi comuni per l’annotazione di set di dati grezzi, che includono sia tecniche di etichettatura umane che automatizzate.

Quantificazione dell’incertezza: approcci e metodi

Brian Lucena | Principal | Numeristical

Inizieremo con una panoramica su perché è importante quantificare l’incertezza intorno alle previsioni di un modello. Discuteremo di come l’UQ differisce nei problemi di classificazione rispetto a quelli di regressione e introduceremo i vari approcci. Questo workshop fornirà il contesto teorico di questi metodi e poi si immergerà in esempi reali delle loro applicazioni utilizzando i notebook di Jupyter.

Data Morph: una storia illustrativa delle statistiche di sintesi

Stefanie Molin | Ingegnere software, scienziato dei dati, responsabile della sicurezza informatica, autrice di Hands-On Data Analysis with Pandas | Bloomberg

In questa presentazione, Stefanie parlerà di Data Morph, un pacchetto open source che si basa su ricerche precedenti di Autodesk che utilizza l’annealing simulato per deformare un insieme di dati di input arbitrario in una varietà di forme, preservando la media, la deviazione standard e la correlazione fino a molti decimali. Verrà illustrato come funziona, si discuteranno le sfide affrontate durante lo sviluppo e si esploreranno i limiti di questo approccio.

EVENTO – ODSC West 2023

Conferenza in persona e virtuale

30 ottobre – 2 novembre

Unisciti a noi per approfondire le ultime tendenze, strumenti e tecniche di data science e AI, dai LLM all’analisi dei dati e dall’apprendimento automatico alla AI responsabile.

 

Causal AI: dai dati all’azione

Dr. Andre Franca | CTO | connectedFlow

In questa presentazione, esploreremo e sveleremo il mondo della Causal AI per i praticanti della data science, con un focus sull’interpretazione delle relazioni causa-effetto all’interno dei dati per guidare decisioni ottimali. Ci concentreremo su shapley, DAG (directed acyclic graph), scoperta della causalità e decisioni ottimali.

Completare la scoperta della conoscenza rapidamente e con alta qualità con l’AI

Alex Liu, Ph.D. | Fondatore e Direttore | RMDS Lab

In questa presentazione, il nostro relatore comincerà conducendo una revisione completa di una lista di comuni fattori di fallimento. Inoltre, presenteranno un approccio ecosistemico basato sull’intelligenza artificiale per la scoperta della conoscenza e discuteranno un test del mondo reale di questo approccio che coinvolge 14 progetti di scoperta della conoscenza. Attraverso questo, i partecipanti acquisiranno preziose intuizioni sulla connessione cruciale tra il successo dei progetti di scoperta della conoscenza basati sui dati e gli avanzamenti nella tecnologia dell’intelligenza artificiale. I partecipanti comprenderanno anche come questo approccio ecosistemico possa portare notevoli guadagni in velocità, qualità migliorata e mitigazione efficace del rischio per le iniziative di scoperta della conoscenza.

Colmare il divario di interpretabilità nella segmentazione dei clienti

Evie Fowler | Data Scientist Senior | Fulcrum Analytics

Storicamente, ci sono state due principali approcci alla segmentazione: basata su regole e basata sull’apprendimento automatico. In questa presentazione, Evie presenterà un nuovo approccio ibrido che combina i migliori aspetti di entrambi i metodi. Il processo inizia con un’osservazione attenta dei dati dei clienti e una valutazione se ci sono cluster formati naturalmente nei dati. Prosegue con la selezione di un algoritmo di clustering e il raffinamento di un modello per creare i cluster. Dopo di ciò, viene effettuata un’analisi aggiuntiva dei dati esplorativi per capire cosa differenzia ciascun cluster dagli altri. Infine, viene utilizzata un’approssimazione lineare per creare una rappresentazione semplice dell’algoritmo di clustering basato sull’apprendimento automatico.

Intelligenza Artificiale Orientata alle Persone

Peter Norvig, PhD | Direttore dell’Ingegneria, Education Fellow | Google, Stanford Institute for Human-Centered Artificial Intelligence (HAI)

Abbiamo assistito a un incredibile progresso tecnico nelle applicazioni di intelligenza artificiale negli ultimi anni. Questa presentazione considera il lato umano anziché quello tecnico: come possiamo acquisire fiducia che le nostre applicazioni saranno giuste, veritiere, benefiche e ben messe per gli utenti, gli altri stakeholder e la società nel suo complesso.

Apprendimento di Rappresentazioni su Grafi e Reti

Dr. Petar Veličković Staff Research Scientist | Affiliated Lecturer DeepMind | University of Cambridge

In questa presentazione, Petar cercherà di fornire alcune visioni di insieme sulle GNN (Reti Neurali a Grafico). Dopo una rapida motivazione sull’utilità dell’apprendimento di rappresentazioni di grafi, dedurrà le GNN dai principi fondamentali dell’invarianza e dell’equivarianza delle permutazioni. Discuteremo come possiamo costruire GNN che non dipendono strettamente dalla struttura del grafo in ingresso. La presentazione sarà rivolta a un pubblico generico di informatica, anche se una conoscenza di base dell’apprendimento automatico con reti neurali sarà un prerequisito utile.

L’apprendimento automatico è diventato Necromanzia

Mark Saroufim | Autore | Breaking Stagnation

L’apprendimento automatico ha subito una profonda trasformazione con l’open source. Da una tecnologia che poteva solo eseguire adattamento di curve naive, a una tecnologia che potenzialmente potrebbe porre fine alla dominazione dell’umanità. Nel 2017, Ali Rahimi dichiarò che l’apprendimento automatico è la nuova alchimia e noi vorremmo andare oltre, sostenendo che l’apprendimento automatico è la nuova necromanzia. Una scienza dimenticata con un etos appassionatamente forte dell’open source che è stata alla fine distrutta dalla chiesa cattolica.

Rilevamento delle anomalie per i dati di produzione del CRM

Geeta Shankar, Ingegnere del software e Tuli Nivas, Architetto dell’ingegneria del software | Salesforce

Nella nostra presentazione tecnica, dimostreremo il valore dell’apprendimento automatico e delle visualizzazioni analitiche nella risoluzione delle sfide dell’analisi dei dati del mondo reale. Mostreremo come il nostro sistema di produzione basato sui dati affronta queste sfide, sottolineando l’importanza dell’analisi dei dati nel garantire sistemi affidabili e costruire la fiducia dei clienti.

Dati Mancanti: Un’Approccio ai Dati Sintetici per l’Imputazione dei Dati Mancanti

Fabiana Clemente | Co-fondatrice e CDO | YData

In questa presentazione, affronteremo l’uso di modelli generativi, come LLM e GAN, per la generazione di dati sintetici intelligenti che possono essere sfruttati per l’imputazione dei dati mancanti. Utilizzando un modello generativo per l’imputazione dei dati mancanti, possiamo generare nuovi campioni rappresentativi della distribuzione dei dati sottostante, il che può aiutare a ridurre l’impatto dei dati mancanti sui nostri modelli. Inoltre, questi modelli possono essere tarati su set di dati specifici, consentendoci di generare dati sintetici adattati al nostro caso d’uso specifico.

Impara metodi migliori per un migliore apprendimento automatico a ODSC West 2023

Per approfondire questi argomenti, unisciti a noi a ODSC West 2023 dal 30 ottobre al 2 novembre, sia di persona che virtualmente. La conferenza includerà anche sessioni di formazione pratiche in aree di focalizzazione come l’apprendimento automatico, il deep learning, MLOps e l’ingegneria dei dati, l’AI responsabile e altro ancora. Inoltre, puoi estendere la tua formazione coinvolgente a 4 giorni con un pass per il bootcamp. Scopri tutti i tipi di pass qui.