Gestire il debito tecnico dei sistemi di apprendimento automatico

Gestione del debito tecnico nei sistemi di apprendimento automatico

Esplora le pratiche per mitigare in modo sostenibile il costo della consegna rapida – con codici di implementazione

Con l’avanzare della comunità di machine learning (ML) nel corso degli anni, le risorse disponibili per lo sviluppo di progetti di ML sono abbondanti. Ad esempio, possiamo fare affidamento sul pacchetto generico di Python scikit-learn, che si basa su NumPy, SciPy e matplotlib, per la preelaborazione dei dati e per le attività predictive di base. Oppure possiamo sfruttare la collezione open-source di modelli pre-addestrati di Hugging Face per l’analisi di diversi tipi di dataset. Questi strumenti permettono agli attuali data scientist di affrontare rapidamente ed efficacemente compiti standard di ML ottenendo risultati moderatamente buoni.

Tuttavia, l’abbondanza di strumenti di ML spesso porta i responsabili aziendali e persino gli operatori a sottovalutare lo sforzo necessario per costruire sistemi di ML a livello aziendale. In particolare, quando si affrontano scadenze di progetto stringenti, le squadre possono accelerare il rilascio dei sistemi in produzione senza dedicare sufficiente attenzione tecnica. Di conseguenza, il sistema di ML spesso non soddisfa le esigenze aziendali in modo tecnicamente sostenibile e mantenibile.

Man mano che il sistema evolve e viene rilasciato nel tempo, si accumulano debiti tecnici – Più a lungo il costo implicito rimane senza essere affrontato, più diventa costoso correggerli.

Foto di Andrea De Santis su Unsplash

Ci sono diverse fonti di debiti tecnici nel sistema di ML. Alcuni di essi sono inclusi di seguito.

<h2 id="progettazione-del-codice-inf