Incontra Robocat di DeepMind un nuovo modello di intelligenza artificiale progettato per operare su più robot.

Meet Robocat by DeepMind, a new AI model designed to operate on multiple robots.

I robot stanno entrando rapidamente nella cultura mainstream, ma sono generalmente limitati nelle loro capacità a causa della loro programmazione. Nonostante i potenziali vantaggi dell’incorporazione degli ultimi progressi dell’IA nella progettazione dei robot, il progresso nello sviluppo di robot a uso generale rimane lento a causa del tempo necessario per acquisire dati di formazione del mondo reale.

Lo sviluppo di robot con la capacità di imparare molte attività contemporaneamente e di integrare la comprensione dei modelli linguistici con le capacità pratiche di un robot assistente è un’area che è stata oggetto di ampi studi.

RoboCat di DeepMind è il primo agente che può risolvere e adattarsi a varie attività su diversi tipi di robot reali. I risultati mostrano che RoboCat impara significativamente più rapidamente rispetto ad altri modelli all’avanguardia. Poiché impara da un dataset così grande e vario, può acquisire una nuova abilità con solo 100 dimostrazioni. Questa capacità è cruciale per lo sviluppo di un robot multipurpose e accelererà la ricerca sui robot riducendo i requisiti di formazione supervisionati dall’uomo.

Il loro modello multimodale Gato (spagnolo per “gatto”), è la base per RoboCat, poiché può elaborare parole, immagini e azioni sia in ambienti virtuali che reali. Il loro lavoro fonde la struttura di Gato con un enorme dataset di formazione contenente i dati visivi e di movimento di centinaia di bracci robotici che svolgono diversi compiti. Dopo questa fase di formazione iniziale, il team ha sottoposto RoboCat a un ciclo di formazione di “auto-miglioramento” con un nuovo insieme di attività. Ogni nuova attività è stata appresa in cinque fasi:

  • Raccolta di cento a mille esempi di una nuova attività o di un robot che viene mostrato con un braccio robotico controllato dall’uomo.
  • Perfezionamento di RoboCat per la nuova attività/braccio per produrre un agente spin-off con capacità specializzate.
  • L’agente figlio esegue 10.000 ripetizioni di pratica sulla nuova attività/braccio, aggiungendo al pool di dati di formazione.
  • Mescolare i dati di esempio con le creazioni dell’utente e i dati di dimostrazione nell’attuale set di dati di RoboCat.
  • Riformazione di RoboCat utilizzando il dataset aggiornato.

L’ultima versione di RoboCat si basa su un dataset contenente milioni di traiettorie da bracci robotici reali e simulati, nonché dati creati dal sistema stesso, grazie a tutto questo training. I dati basati sulla visione che rappresentano i lavori che RoboCat imparerà ad eseguire sono stati raccolti utilizzando quattro tipi di robot distinti e molti bracci robotici.

RoboCat è stato addestrato ad usare diversi bracci robotici in poche ore. Ha imparato ad usare un braccio più complicato con una pinza a tre dita e il doppio degli input controllati, nonostante fosse stato insegnato su bracci con pinze a due denti.

RoboCat ha imparato a controllare questo nuovo braccio abbastanza abilmente da raccogliere ingranaggi l’86% delle volte dopo aver assistito a 1000 dimostrazioni controllate dall’uomo raccolte in poche ore. Lo stesso grado di dimostrazione gli ha permesso di imparare a fare compiti che richiedevano precisione e conoscenza, come scegliere il frutto giusto da una ciotola e risolvere un puzzle di abbinamento di forme.

La formazione di RoboCat è autoperpetuante; più impara, più migliora la sua capacità di apprendere. Il team mostra che dopo aver imparato da 500 demo di ogni attività, la versione originale di RoboCat era solo il 36% più efficace nell’eseguire attività che non aveva mai visto prima. Tuttavia, il più recente RoboCat addestrato su varie attività ha avuto il doppio del successo.

Il team ritiene che RoboCat aprirà la strada a una nuova generazione di agenti robotici più utili e a uso generale perché può apprendere autonomamente e sviluppare rapidamente le competenze, specialmente quando applicato a più attrezzature robotiche.