Il feedback proveniente dalla collaborazione del pubblico aiuta ad addestrare i robot

La feedback proveniente dalla collaborazione del pubblico contribuisce all'addestramento dei robot

Questo nuovo approccio consente di raccogliere feedback in modo asincrono, in modo che gli utenti non esperti di tutto il mondo possano contribuire all'insegnamento dell'agente. ¶ Credito: Christine Daniloff, MIT/iStock

Un approccio di apprendimento per rinforzo sviluppato da ricercatori del Massachusetts Institute of Technology (MIT), dell’Università di Harvard e dell’Università di Washington addestra i robot utilizzando feedback provenienti da utenti non esperti raccolti in modo collaborativo.

Marcel Torne del MIT ha affermato che, con il metodo “Human Guided Exploration” (HuGE), “La funzione di ricompensa guida l’agente verso ciò che dovrebbe esplorare, anziché dirgli esattamente cosa fare per completare il compito.”

I ricercatori hanno diviso il processo in due parti, utilizzando un algoritmo selettore di obiettivi aggiornato continuamente con il feedback umano raccolto in modo collaborativo e un altro algoritmo che consente all’agente di intelligenza artificiale di esplorare in modo autonomo guidato dal selettore di obiettivi.

In entrambi i test simulati e nel mondo reale, HuGE ha permesso agli agenti di raggiungere gli obiettivi più rapidamente rispetto ad altri metodi. Da MIT News Visualizza Articolo Completo

Abstracts Copyright © 2023 SmithBucklin, Washington, D.C., USA