Decodificare l’ecosistema della scienza dei dati con Vikas Agrawal

Esplorando l'ecosistema della scienza dei dati con Vikas Agrawal

Esplora il futuro dell’IA con il Dott. Vikas Agrawal, Principal Data Scientist presso Oracle Analytics Cloud. In questa sessione Leading with Data, condivide approfondimenti sulla risoluzione dei problemi nella scienza dei dati, MLops e l’impatto dell’IA generativa sulle soluzioni aziendali. La discussione spazia da approcci pratici a trappole nei progetti di scienza dei dati, offrendo consigli essenziali per gli aspiranti scienziati dei dati.

Principali consigli dalla nostra conversazione con Vikas Agrawal

  • Nella scienza dei dati, concentrarsi sulla comprensione del problema è cruciale e richiede la maggior parte dello sforzo.
  • Un Proof of Concept (POC) di successo nella scienza dei dati dovrebbe considerare non solo gli aspetti tecnici, ma anche la praticità e la scalabilità della soluzione.
  • La comunicazione chiara e la definizione di aspettative realistiche con i clienti sono vitali per evitare costosi fraintendimenti alimentati dall’entusiasmo per l’IA.
  • L’IA generativa ha il potenziale per rivoluzionare le soluzioni aziendali, soprattutto in aree legate al testo e alle interfacce utente.
  • Costruire una carriera nella scienza dei dati richiede una solida base in matematica e una profonda comprensione degli algoritmi.
  • Nell’ambito aziendale, garantire l’affidabilità e la sicurezza delle uscite dell’IA richiede nuove tecniche di convalida.
  • Alla luce dell’evoluzione degli strumenti AI, i data scientist devono possedere competenze per migliorarli e potenziarli, non solo per utilizzarli.

Scopri altre sessioni informative con i principali esperti di AI e Scienza dei Dati sul nostro canale comunitario!

Come bilanci la profondità tecnica con una visione macro nella scienza dei dati?

Nel mio lavoro quotidiano, devo molto ai miei mentori provenienti da varie istituzioni ed aziende di prestigio, che mi hanno trasmesso la filosofia che la tecnologia è un mezzo per un fine, non l’obiettivo stesso. La chiave è dedicare una quantità significativa di tempo alla comprensione del problema: circa il 90% dello sforzo richiesto. Il resto riguarda la ricerca di soluzioni, che spesso implica l’analisi di come altri abbiano affrontato problemi simili e quali siano le esigenze del cliente. Questo approccio è fondamentale per collegare la tecnologia all’impatto commerciale.

Qual è il tuo approccio per risolvere i problemi dei clienti?

Dopo aver identificato un problema che vale la pena risolvere, ci assicuriamo innanzitutto di avere i dati necessari per affrontarlo. Successivamente, valutiamo se esiste la tecnologia per risolvere il problema entro un periodo ragionevole. Se intravediamo una strada, anche se può richiedere un paio d’anni, procederemo con un proof of concept (POC). Questo POC è completo e copre tutto, dalle pipeline dei dati alla funzionalità end-to-end, sebbene la scalabilità in questa fase non sia la preoccupazione principale. L’obiettivo è avere una chiara visione degli algoritmi, delle fonti di dati e della natura dell’output che stiamo cercando.

Come affronti la fase di ottimizzazione e gli ML ops?

Dopo un POC di successo, entriamo nella fase di ottimizzazione, dove risiede la maggior parte del lavoro. Ciò implica assicurarsi che il modello si adatti a diversi processi aziendali e geografie, e che possa correggersi quando esce dalla distribuzione. Si tratta anche di garantire che il modello possa essere riaddestrato in modo efficiente e scalabile. Questa fase è fondamentale perché è qui che il modello passa da un concetto a una soluzione pratica e implementabile.

Quali sono le trappole più comuni nei progetti di scienza dei dati?

Gli errori più costosi sono solitamente legati all’eccesso di enfasi sull’IA e alla mancanza di comunicazione. È fondamentale stabilire aspettative chiare e reciproche con il cliente. Spesso, i clienti hanno alte aspettative dovute al clamore dell’industria intorno all’IA, senza rendersi conto che lo stato dell’arte potrebbe non sempre fornire le risposte corrette che cercano. Un’altra trappola consiste nel definire erroneamente il problema, sia nello non affrontare direttamente il problema del cliente, sia nel cercare di analizzare tutto in maniera generale.

Come interagisci con l’IA generativa nei tuoi flussi di lavoro?

L’IA generativa non è ampiamente utilizzata nella maggior parte delle aziende a causa di preoccupazioni legate al copyright e alla contaminazione di proprietà intellettuale. Tuttavia, ci avvaliamo di materiali open source disponibili commercialmente. L’IA generativa ha raggiunto livelli avanzati in aree come la sintesi del testo, l’espansione del testo e la fornitura di spiegazioni. L’affidabilità rimane una sfida e stiamo esplorando tecniche per filtrare le uscite dai grandi modelli di linguaggio (LLM) per garantire che siano affidabili per l’uso aziendale.

Quali ripercussioni prevedi che avrà l’IA generativa sulle soluzioni aziendali?

L’IA generativa avrà probabilmente il maggiore impatto sui flussi di lavoro che coinvolgono il testo in esecuzione, come il recupero delle informazioni e le interfacce utente. Ad esempio, può migliorare notevolmente la ricerca aziendale recuperando frammenti di testo semanticamente simili. Può anche rivoluzionare le interfacce di linguaggio naturale per i database, consentendo agli utenti di porre domande in linguaggio naturale e ottenere risposte SQL accurate.

Quali consigli daresti a coloro che entrano nel campo della data science oggi?

È un momento eccitante per essere nel campo della data science, ma è fondamentale avere una solida base di matematica e capire gli algoritmi con cui si sta lavorando. Man mano che gli strumenti di intelligenza artificiale diventano sempre più sofisticati, la capacità di ampliarli e migliorarli sarà una competenza preziosa. Coloro che riescono a creare nuovi algoritmi o a comprendere le complessità di quelli esistenti saranno molto richiesti.

Sintesi della conversazione con Vikas Agrawal

In questa sessione illuminante, il dott. Vikas Agrawal ha condiviso spunti chiave per il successo nella carriera della data science. Dall’emphasize sulla comprensione del problema alla navigazione degli ostacoli e all’adozione dell’IA generativa, l’intervista fornisce una roadmap. Ai futuri data scientist viene consigliato di costruire una solida base di matematica e algoritmi per un settore in continua evoluzione. Questa intervista annuncia una nuova era di innovazione nell’IA.

Resta sintonizzato con noi su Leading with Data per seguire i percorsi di altri pionieri leader nell’intelligenza artificiale e nella data science dell’industria. Puoi controllare le nostre prossime sessioni di Leading with Data qui!