Come tracciare e visualizzare gli esperimenti di Machine Learning utilizzando MLflow

Come tracciare e visualizzare gli esperimenti di ML con MLflow

MLflow – una piattaforma open-source per gestire il ciclo di vita del machine learning.

Introduzione

Nel machine learning non esiste il pranzo gratuito. Non sappiamo quale pre-elaborazione dei dati o quale algoritmo di machine learning sia il migliore per il problema specifico. Non esiste un unico algoritmo che si comporta meglio. Ecco perché sperimentare è il metodo tipico per ottenere il risultato appropriato. Per condurre esperimenti di machine learning efficaci, dobbiamo tenere traccia, ricordare e visualizzare ogni esecuzione sperimentale.

Esempio di visualizzazione MLflow ui (gif dell'autore)

Tabella dei contenuti

Cosa – cos’è il tracciamento degli esperimenti?

Perché – perché il tracciamento degli esperimenti è importante?

Come – come farlo?

Demo pratica del tracciamento sperimentale utilizzando MLFlow

Cos’è il tracciamento degli esperimenti di machine learning?

Il tracciamento degli esperimenti è il processo di tenere traccia di tutte le informazioni rilevanti di un esperimento di machine learning, come ad esempio:

  • Codice sorgente
  • Ambiente
  • Dati
  • Modello
  • Risultato intermedio
  • Iperparametri
  • Metriche
  • Ecc.

Ecco alcuni termini che è necessario ricordare:

  • Esperimento di machine learning: il processo iterativo di costruzione di un modello di machine learning
  • Esecuzione dell’esperimento: una prova in un esperimento di machine learning
  • Artefatto di esecuzione: qualsiasi dato file associato all’esecuzione di un esperimento di machine learning
  • Metadati dell’esperimento: tutte le informazioni relative agli esperimenti

Perché – il tracciamento degli esperimenti è importante?

Il tracciamento degli esperimenti è fondamentale per diverse ragioni, ad esempio:

  • Riproducibilità: registrando tutte le configurazioni rilevanti degli esperimenti, inclusa la versione dei dati, del modello, degli iperparametri, del seme casuale, ecc., possiamo ricreare lo stesso ambiente e ripetere l’esperimento se necessario. Ciò garantisce che i risultati possano essere riprodotti e verificati da altri.
  • Collaborazione: ci consente di organizzare…