Il feedback proveniente dalla collaborazione del pubblico aiuta ad addestrare i robot
La feedback proveniente dalla collaborazione del pubblico contribuisce all'addestramento dei robot
Un approccio di apprendimento per rinforzo sviluppato da ricercatori del Massachusetts Institute of Technology (MIT), dell’Università di Harvard e dell’Università di Washington addestra i robot utilizzando feedback provenienti da utenti non esperti raccolti in modo collaborativo.
Marcel Torne del MIT ha affermato che, con il metodo “Human Guided Exploration” (HuGE), “La funzione di ricompensa guida l’agente verso ciò che dovrebbe esplorare, anziché dirgli esattamente cosa fare per completare il compito.”
I ricercatori hanno diviso il processo in due parti, utilizzando un algoritmo selettore di obiettivi aggiornato continuamente con il feedback umano raccolto in modo collaborativo e un altro algoritmo che consente all’agente di intelligenza artificiale di esplorare in modo autonomo guidato dal selettore di obiettivi.
In entrambi i test simulati e nel mondo reale, HuGE ha permesso agli agenti di raggiungere gli obiettivi più rapidamente rispetto ad altri metodi. Da MIT News Visualizza Articolo Completo
- Programmazione Metal in Julia
- Quantificazione dei modelli di trasporto utilizzando i dati GTFS
- StyleTTS 2 Text-to-Speech a livello umano con grandi modelli di linguaggio del parlato
Abstracts Copyright © 2023 SmithBucklin, Washington, D.C., USA