Incontra LocoMuJoCo Un nuovo punto di riferimento di apprendimento automatico progettato per facilitare una valutazione rigorosa e il confronto degli algoritmi di apprendimento per imitazione.

Incontra LocoMuJoCo Un nuovo riferimento per l'apprendimento automatico che semplifica la valutazione e il confronto degli algoritmi di apprendimento per imitazione

I ricercatori del gruppo Intelligent Autonomous Systems, del laboratorio di locomozione, del centro di ricerca tedesco per l’IA, del centro per la scienza cognitiva e di Hessian.AI hanno introdotto un benchmark per promuovere la ricerca nell’apprendimento per imitazione (IL) per la locomozione, affrontando le limitazioni delle misure esistenti che spesso si concentrano su compiti semplificati. Questo nuovo benchmark comprende ambienti diversi, tra cui quadrupedi, bipedi e modelli umani muscolo-scheletrici, accompagnati da set di dati completi. Incorpora dati reali di acquisizione del movimento rumorosi, dati di esperti veri e dati di sottottima verità, consentendo valutazioni su vari livelli di difficoltà.

Affrontando le limitazioni dei benchmark esistenti, LocoMuJoCo fornisce ambienti diversi come quadrupedi, bipedi e modelli umani muscolo-scheletrici. Accompagnato da dati di acquisizione del movimento rumorosi reali, dati di esperti veri e dati subottimali, il benchmark facilita una valutazione completa degli algoritmi di IL su diversi livelli di difficoltà. Lo studio sottolinea la necessità di metriche basate su distribuzioni di probabilità e principi biomeccanici per una valutazione efficace della qualità del comportamento.

LocoMuJoCo, un benchmark basato su Python dedicato a IL nei compiti di locomozione, mira ad affrontare i problemi di standardizzazione negli standard esistenti. LocoMuJoCo è compatibile con le librerie Gymnasium e Mushroom-RL, offrendo compiti e set di dati diversi per la locomozione umanoide e quadrupede e per i modelli umani muscolo-scheletrici. La misura copre vari paradigmi di IL, tra cui incongruenze dell’incarnazione, apprendimento con o senza azioni esperte e gestione di stati e azioni esperti sottotimali. Fornisce basi per approcci classici di IRL e IL avversariali, tra cui GAIL, VAIL, GAIfO, IQ-Learn, LS-IQ e SQIL, implementati con Mushroom-RL.

LocoMuJoCo è un benchmark che offre ambienti diversi come quadrupedi, bipedi e modelli umani muscolo-scheletrici accompagnati da set di dati completi. Con un’interfaccia facile per la randomizzazione dinamica e compiti parzialmente osservabili per addestrare agenti in diverse incarnazioni, il benchmark include metriche fatte a mano e algoritmi di base all’avanguardia e supporta vari paradigmi di IL. Il modello è facilmente estendibile con interfacce user-friendly per librerie RL comuni.

LocoMuJoCo è un benchmark esteso per l’apprendimento per imitazione nei compiti di locomozione, che offre ambienti diversi e set di dati completi. Facilita la valutazione e il confronto degli algoritmi IL con metriche fatte a mano, algoritmi di base all’avanguardia e supporto per vari paradigmi di IL. Lo standard copre quadrupedi, bipedi e modelli umani muscolo-scheletrici, offrendo compiti parzialmente osservabili per diverse incarnazioni. LocoMuJoCo garantisce una valutazione su vari livelli di difficoltà.

LocoMuJoCo mira a superare le limitazioni negli standard esistenti e facilitare una valutazione rigorosa degli algoritmi IL. Comprende ambienti diversi, tra cui quadrupedi, bipedi e modelli umani muscolo-scheletrici, offrendo set di dati completi con diversi livelli di difficoltà. Lo standard è facilmente estendibile e compatibile con librerie RL comuni, e lo studio riconosce la necessità di ulteriori ricerche nello sviluppo di metriche basate su distribuzioni di probabilità e principi biomeccanici.

La ricerca individua un problema aperto nei benchmark di apprendimento per imitazione, sottolineando la sfida di misurare efficacemente la qualità del comportamento clonato. Incoraggia ulteriori ricerche per sviluppare metriche basate sulla divergenza tra distribuzioni di probabilità e principi biomeccanici. Viene evidenziata l’importanza di esplorare dataset di esperti classificati per preferenze nell’ambito dell’apprendimento per imitazione basato sulle preferenze, specialmente quando sono disponibili solo dimostrazioni sottotimali. Estendere il benchmark per includere più ambienti e compiti per una valutazione completa. Incoraggia l’esplorazione di vari algoritmi IL utilizzando la misura versatile di LocoMuJoCo.