Un sistema robotico a quattro zampe per giocare a calcio su vari terreni.

A robotic four-legged system for playing soccer on various terrains.

DribbleBot può manovrare un pallone da calcio su superfici come sabbia, ghiaia, fango e neve, utilizzando l’apprendimento per rinforzo per adattarsi alle diverse dinamiche della palla.

Researchers created DribbleBot, a system for in-the-wild dribbling on diverse natural terrains including sand, gravel, mud, and snow using onboard sensing and computing. In addition to these football feats, such robots may someday aid humans in search-and-rescue missions.

Se hai mai giocato a calcio con un robot, è una sensazione familiare. Il sole splende sul tuo viso mentre l’odore dell’erba permea l’aria. Guardi intorno. Un robot a quattro zampe si sta avvicinando a te, dribblando con determinazione.

Anche se il robot non mostra un livello di abilità come Lionel Messi, è comunque un impressionante sistema di dribbling. I ricercatori del MIT’s Improbable Artificial Intelligence Lab, parte del Computer Science and Artificial Intelligence Laboratory (CSAIL), hanno sviluppato un sistema robotico a gambe che può dribblare un pallone da calcio nelle stesse condizioni degli esseri umani. Il robot utilizza una miscela di sensori e elaborazione a bordo per percorrere diversi terreni naturali come sabbia, ghiaia, fango e neve e adattarsi alla loro variazione sull’effetto del movimento della palla. Come ogni atleta impegnato, “DribbleBot” potrebbe rialzarsi e recuperare il pallone dopo una caduta.

Programmare i robot per giocare a calcio è un’area di ricerca attiva da tempo. Tuttavia, il team voleva imparare automaticamente come attivare le gambe durante il dribbling, per consentire la scoperta di abilità difficili da scrivere per rispondere a terreni diversi come neve, ghiaia, sabbia, erba e pavimentazione. Entra in gioco la simulazione.

Un robot, un pallone e un terreno sono all’interno della simulazione, un gemello digitale del mondo naturale. È possibile caricare il robot e altri asset e impostare i parametri fisici, e poi la simulazione gestisce la simulazione in avanti della dinamica da lì. Quattromila versioni del robot sono simulate in parallelo in tempo reale, consentendo la raccolta di dati 4.000 volte più veloce rispetto all’uso di un solo robot. Questo è molto dato.

Il robot inizia senza sapere come dribblare la palla: riceve solo una ricompensa quando lo fa o una negativa quando sbaglia. Quindi, sta cercando essenzialmente di capire quale sequenza di forze dovrebbe applicare con le sue gambe. “Un aspetto di questo approccio di apprendimento per rinforzo è che dobbiamo progettare una buona ricompensa per facilitare l’apprendimento di un comportamento di dribbling di successo da parte del robot”, dice il dottorando del MIT Gabe Margolis, che ha co-diretto il lavoro insieme a Yandong Ji, assistente di ricerca presso l’Improbable AI Lab. “Una volta progettata questa ricompensa, è tempo di fare pratica per il robot: in tempo reale, sono un paio di giorni, mentre nella simulazione sono centinaia di giorni. Nel tempo impara a diventare sempre più abile nel manipolare il pallone da calcio per corrispondere alla velocità desiderata”.

Il robot poteva anche navigare in terreni sconosciuti e riprendersi dalle cadute grazie a un controller di recupero integrato dal team nel suo sistema. Questo controller consente al robot di rialzarsi dopo una caduta e tornare al suo controller di dribbling per continuare a cercare il pallone, aiutandolo a gestire le interruzioni e i terreni fuori distribuzione.

“Se guardi intorno oggi, la maggior parte dei robot ha le ruote. Ma immagina uno scenario di disastro, come un’inondazione o un terremoto, e vogliamo che i robot aiutino gli umani nel processo di ricerca e salvataggio. Abbiamo bisogno che le macchine vadano su terreni non piani, e i robot con le ruote non possono attraversare questi paesaggi”, dice Pulkit Agrawal, professore del MIT, principal investigator di CSAIL e direttore di Improbable AI Lab. “L’intero punto di studiare i robot a gambe è quello di andare su terreni al di fuori della portata dei sistemi robotici attuali”, aggiunge. “Il nostro obiettivo nello sviluppare algoritmi per robot a gambe è quello di fornire autonomia in terreni impegnativi e complessi che sono attualmente al di fuori della portata dei sistemi robotici”.

La fascinazione per i quadrupedi robotici e il calcio è profonda: il professore canadese Alan Mackworth ha per primo notato l’idea in un articolo intitolato “On Seeing Robots”, presentato al VI-92 nel 1992. I ricercatori giapponesi hanno in seguito organizzato un workshop su “Grandi sfide nell’intelligenza artificiale”, che ha portato a discussioni sull’uso del calcio per promuovere la scienza e la tecnologia. Il progetto è stato lanciato come Robot J-League un anno dopo e ha suscitato un fervore globale. Poco dopo, è nato “RoboCup”.

Rispetto alla sola camminata, il dribbling di un pallone da calcio impone maggiori vincoli al movimento di DribbleBot e ai terreni che può percorrere. Il robot deve adattare la sua locomozione per applicare forze al pallone per dribblare. L’interazione tra il pallone e il paesaggio potrebbe essere diversa rispetto all’interazione tra il robot e il paesaggio, come l’erba spessa o la pavimentazione. Ad esempio, un pallone da calcio esperimenterà una forza di resistenza sull’erba che non è presente sulla pavimentazione, e una pendenza applicherà una forza di accelerazione, cambiando il percorso tipico della palla. Tuttavia, la capacità del robot di percorrere diversi terreni è spesso meno influenzata da queste differenze nella dinamica, a patto che non scivoli, quindi il test del calcio può essere sensibile alle variazioni del terreno che la sola locomozione non è.

“Le approcci passati semplificano il problema del dribbling, facendo un’assunzione di modellizzazione di terreno piatto e duro. Il movimento è anche progettato per essere più statico; il robot non sta cercando di correre e manipolare la palla contemporaneamente,” dice Ji. “Ecco dove entrano in gioco dinamiche più difficili nel problema di controllo. Abbiamo affrontato questo problema estendendo i recenti progressi che hanno permesso una migliore locomozione all’aperto in questo compito composto che combina aspetti di locomozione e manipolazione abile insieme.”

Sul lato hardware, il robot ha un insieme di sensori che gli permettono di percepire l’ambiente, consentendogli di sentire dove si trova, “comprendere” la sua posizione e “vedere” parte del suo ambiente circostante. Ha un insieme di attuatori che gli permettono di applicare forze e muoversi ed oggetti. Tra i sensori e gli attuatori si trova il computer, o “cervello”, incaricato di convertire i dati dei sensori in azioni, che applicherà attraverso i motori. Quando il robot corre sulla neve, non vede la neve ma può sentirne la presenza attraverso i suoi sensori motori. Ma il calcio è una impresa più impegnativa rispetto al camminare — così la squadra ha sfruttato le telecamere sulla testa e sul corpo del robot per una nuova modalità sensoriale della vista, oltre alla nuova abilità motoria. E poi… dribbiamo.

“Il nostro robot può andare in luoghi selvaggi perché porta tutti i suoi sensori, telecamere e calcoli a bordo. Ciò ha richiesto alcune innovazioni in termini di adattare l’intero controller a questa elaborazione a bordo”, dice Margolis. “Questo è un’area in cui l’apprendimento aiuta perché possiamo eseguire una rete neurale leggera e addestrarla per elaborare dati di sensori rumorosi osservati dal robot in movimento. Questo è in netto contrasto con la maggior parte dei robot oggi: tipicamente un braccio robotico è montato su una base fissa e si trova su un banco di lavoro con un gigantesco computer collegato direttamente ad esso. Né il computer né i sensori si trovano nel braccio robotico! Quindi, il tutto è pesante e difficile da muovere.”

C’è ancora molta strada da fare per rendere questi robot agili come i loro omologhi nella natura, e alcuni terreni sono stati impegnativi per DribbleBot. Attualmente, il controller non è addestrato in ambienti simulati che includono pendenze o scale. Il robot non sta percependo la geometria del terreno; sta solo stimando le sue proprietà di contatto materiale, come la frizione. Se c’è un gradino, ad esempio, il robot si fermerà — non sarà in grado di sollevare la palla sopra il gradino, un’area che la squadra vuole esplorare in futuro. I ricercatori sono anche entusiasti di applicare le lezioni apprese durante lo sviluppo di DribbleBot ad altre attività che coinvolgono la locomozione combinata e la manipolazione degli oggetti, trasportando rapidamente oggetti diversi da un luogo all’altro utilizzando le gambe o le braccia.

“DribbleBot è una dimostrazione impressionante della fattibilità di un tale sistema in uno spazio di problemi complesso che richiede il controllo dinamico dell’intero corpo”, dice Vikash Kumar, un ricercatore presso Facebook AI Research che non ha partecipato al lavoro. “Ciò che è impressionante di DribbleBot è che tutte le abilità sensorimotorie sono sintetizzate in tempo reale su un sistema a basso costo utilizzando risorse di elaborazione a bordo. Sebbene esibisca una notevole agilità e coordinazione, è solo l’inizio per la prossima era. Gioco iniziato!”

La ricerca è supportata dal programma DARPA Machine Common Sense, dal MIT-IBM Watson AI Lab, dall’Istituto di intelligenza artificiale e interazioni fondamentali della National Science Foundation, dal Laboratorio di ricerca dell’Air Force degli Stati Uniti e dall’Acceleratore di intelligenza artificiale dell’Air Force degli Stati Uniti. Un articolo sul lavoro verrà presentato alla Conferenza internazionale su robotica e automazione (ICRA) IEEE 2023.