Questa ricerca sull’IA presenta RoboHive una piattaforma software completa ed ecosistema per la ricerca nel campo dell’apprendimento dei robot e dell’intelligenza artificiale incarnata.

Il mondo dell'intelligenza artificiale prende vita con RoboHive, una piattaforma software completa e un ecosistema dedicato alla ricerca sull'apprendimento dei robot e all'intelligenza artificiale incarnata.

Negli ultimi anni sono stati fatti progressi nell’intelligenza artificiale (AI), soprattutto nella modellazione del linguaggio, nella piegatura delle proteine e nel gameplay. Lo sviluppo dell’apprendimento dei robot è stato modesto. La contraddizione di Moravec, secondo cui i comportamenti sensorimotori sono intrinsecamente più difficili per gli agenti di intelligenza artificiale rispetto alle attività cognitive di alto livello, potrebbe essere in parte responsabile di questo progresso più lento. Inoltre, devono concentrarsi su una questione critica altrettanto importante: la complessità dei framework software per l’apprendimento dei robot e l’assenza di benchmark comuni. Di conseguenza, l’ostacolo di ingresso viene innalzato, la prototipazione rapida è limitata e il flusso di idee è vincolato. La disciplina della robotica continua ad essere più frammentata rispetto ad altre, come la visione artificiale o l’elaborazione del linguaggio naturale, in cui i benchmark e i set di dati sono standardizzati.

Ricercatori dell’Università di Washington, UC Berkeley, CMU, UT Austin, Open AI, Google AI e Meta-AI forniscono RoboHive, un ambiente integrato progettato specificamente per l’apprendimento dei robot, per colmare questa lacuna. RoboHive è una piattaforma che funge sia da strumento di benchmarking che di ricerca. Per consentire una varietà di paradigmi di apprendimento, tra cui il rinforzo, l’imitazione e l’apprendimento trasferibile, offre una vasta gamma di contesti, descrizioni specifiche delle attività e rigorosi criteri di valutazione. Ciò consente agli studiosi di condurre ricerche ed effettuare prototipi in modo efficiente. Inoltre, RoboHive offre integrazione hardware e capacità di teleoperazione ai clienti, consentendo una transizione fluida tra robot reali e virtuali. Vogliono colmare il divario tra lo stato attuale dell’apprendimento dei robot e il suo potenziale di sviluppo utilizzando RoboHive. La creazione e l’open source di RoboHive, un framework unificato per l’apprendimento dei robot, rappresentano il principale contributo del loro lavoro.

Le caratteristiche salienti di RoboHive includono:

1. Zoo dell’Ambiente: RoboHive offre diverse ambientazioni che coprono vari campi accademici. Queste impostazioni possono essere utilizzate per compiti di manipolazione, inclusa la manipolazione abile con la mano, il movimento con robot bipedi e quadrupedi e persino la manipolazione utilizzando modelli muscolo-scheletrici del braccio e della mano. Utilizzano MuJoCo per alimentare i loro mondi virtuali, che offrono una rapida simulazione fisica e sono realizzati con un’attenzione particolare al realismo fisico.

2. RoboHive presenta una astrazione unificante di RobotClass che interagisce in modo fluido con robot virtuali e reali tramite simhooks e hardware hooks. Attraverso la modifica di una singola bandiera, questa capacità speciale consente agli studiosi di interagire facilmente con l’hardware del robot e tradurre le proprie scoperte dalla simulazione alla realtà.

3. Supporto alla teleoperazione e set di dati degli esperti: RoboHive dispone di capacità di teleoperazione immediatamente disponibili tramite varie modalità, tra cui una tastiera, un mouse a 3D e controller per la realtà virtuale. Condividono RoboSet, uno dei più grandi set di dati di manipolazione del mondo reale raccolto tramite teleoperazione umana, che copre 12 abilità in diversi compiti culinari. Gli studiosi che lavorano nell’apprendimento per imitazione, nell’apprendimento offline e in discipline correlate troveranno particolarmente utili queste capacità di teleoperazione e i relativi set di dati.

4. Diversità visiva e fedeltà alla fisica: RoboHive enfatizza i progetti con grande realismo fisico ed estesa diversità visiva, superando i benchmark precedenti, per rivelare la prossima frontiera della ricerca nei robot del mondo reale. Collegano gli studi sul controllo visuomotorio alle difficoltà visive della vita quotidiana, includendo asset complessi, texture ricche e disposizione delle scene potenziate. Inoltre, RoboHive consente nativamente il layout della scena e la randomizzazione del dominio visivo in diverse situazioni, aumentando l’adattabilità della percezione visiva e offrendo materiali fisici realistici e ricchi.

5. Metriche e basi di riferimento: RoboHive utilizza metriche brevi e non ambigue per valutare le prestazioni degli algoritmi in diverse situazioni. Il framework offre un’API simile a un’aula gym per un’integrazione senza soluzione di continuità con gli algoritmi di apprendimento, consentendo l’accessibilità a diversi studiosi e professionisti. Inoltre, RoboHive contiene risultati di baseline completi per algoritmi frequentemente studiati nella comunità della ricerca in collaborazione con TorchRL e mjRL, fornendo un punto di riferimento per il confronto delle prestazioni e lo studio.