Sperimentazione dell’orchestrazione da zero

Esplorazione dell'orchestrazione da zero

Sviluppo di un orchestratore di esperimenti personalizzato per risolvere problemi di modellazione complessi.

Orchestrazione di Daniel Warfield con p5.js. Tutte le immagini sono create dall'autore, a meno che diversamente indicato.

In questo articolo esploreremo l’importanza dell’orchestrazione degli esperimenti, le soluzioni di orchestrazione esistenti, come costruire il proprio orchestratore con MongoDB e perché potrebbe essere vantaggioso in alcuni casi d’uso.

A chi è utile? A chiunque stia cercando di adattare modelli ai dati e, di conseguenza, ha bisogno di un modo per organizzare questi esperimenti.

Quanto avanzato è questo articolo? L’idea di orchestrazione è piuttosto semplice ed è accessibile praticamente a qualsiasi livello di competenza. L’esempio dovrebbe essere accessibile a sviluppatori backend o a data scientist che cercano nuove sfide.

Prerequisiti: Una comprensione pratica dei principi fondamentali di networking, come database e server, nonché dei concetti fondamentali della scienza dei dati, come gli iperparametri.

Codice: Il codice completo può essere trovato qui. Nota: questo repository è in fase di sviluppo al momento della stesura di questo articolo.

Cosa è l’Orchestrazione degli Esperimenti?

Per “orchestrazione degli esperimenti” intendo un ampio numero di compiti che consistono nel medesimo concetto generale. La forma più comune di orchestrazione degli esperimenti sono le ricerche degli iperparametri: dove, dati alcuni valori di iperparametri, si desidera esplorare quei valori e trovare il miglior set di iperparametri per un determinato problema di modellazione. L’organizzazione di questi tipi di esperimenti pianificati è generalmente definita come orchestrazione.

Un esempio di ricerca degli iperparametri. Viene definito uno spazio di iperparametri. Quindi, vengono estratti set specifici di iperparametri da tale spazio e testati in qualche modo. Si può quindi identificare la migliore combinazione di iperparametri.

Le ricerche semplici svolgono il loro compito nella maggior parte dei casi, ma man mano che i problemi di modellazione diventano più complessi, è comune avere esperimenti più complessi. Potresti trovarti nella necessità di sperimentare con più tipi di modelli, ognuno con il proprio spazio di iperparametri, su più dataset.

Ad esempio, attualmente sto conducendo una ricerca sulle prestazioni di diverse strategie di modellazione nelle applicazioni di modellazione non omogenee. Non sono interessato a “qual è il miglior set di iperparametri per risolvere un determinato problema”, ma piuttosto a “come si comportano i diversi tipi di modelli, ognuno con il proprio spazio di iperparametri…