NVIDIA Research vince la sfida di guida autonoma e il premio per l’innovazione al CVPR.

NVIDIA Research wins autonomous driving challenge and innovation award at CVPR.

NVIDIA sarà presentata la prossima settimana come vincitrice della feroce sfida di previsione dell’occupazione 3D per lo sviluppo di auto a guida autonoma alla Conferenza di Visione e Riconoscimento di Pattern (CVPR), a Vancouver, Canada.

La competizione ha ricevuto più di 400 candidature da quasi 150 squadre in 10 regioni.

La previsione dell’occupazione 3D è il processo di previsione dello stato di ogni voxel in una scena, ovvero ogni punto di dati su una griglia di visualizzazione dall’alto in 3D. I voxel possono essere identificati come liberi, occupati o sconosciuti.

Fondamentale per lo sviluppo di sistemi di guida autonoma sicuri e robusti, la previsione della griglia di occupazione 3D fornisce informazioni agli impilamenti di pianificazione e controllo di veicoli autonomi (AV) utilizzando reti neurali convoluzionali e modelli di trasformatori all’avanguardia, che sono abilitati dalla piattaforma NVIDIA DRIVE.

“La soluzione vincente di NVIDIA presenta due importanti progressi per AV”, ha detto Zhiding Yu, scienziato di ricerca senior per l’apprendimento e la percezione presso NVIDIA. “Dimostra una progettazione di modello all’avanguardia che produce un’eccellente percezione della visualizzazione dall’alto. Mostra anche l’efficacia dei modelli di fondamenta visiva con fino a 1 miliardo di parametri e preformazione su larga scala nella previsione dell’occupazione 3D.”

La percezione per la guida autonoma si è evoluta negli ultimi anni dalla gestione di compiti 2D, come la rilevazione di oggetti o spazi liberi nelle immagini, alla ragionevolezza del mondo in 3D con molteplici immagini di input.

Ciò fornisce ora una rappresentazione flessibile e precisa dei singoli oggetti in scene di traffico complesse, che è “critica per soddisfare i requisiti di percezione di sicurezza per la guida autonoma”, secondo Jose Alvarez, direttore della ricerca applicata AV e scienziato distinto presso NVIDIA.

Yu presenterà il lavoro vincente dell’NVIDIA Research team presso il workshop End-to-End Autonomous Driving di CVPR domenica 18 giugno alle 10:20 a.m. PT, nonché presso il Vision-Centric Autonomous Driving Workshop lunedì 19 giugno alle 16:00 p.m. PT.

Oltre a vincere il primo posto nella sfida, NVIDIA riceverà durante l’evento un premio per l’innovazione, riconoscendo i suoi “nuovi approcci nello sviluppo di moduli di trasformazione della vista”, con “prestazioni sostanzialmente migliorate” rispetto ai precedenti approcci, secondo il comitato del workshop CVPR.

Leggi il rapporto tecnico di NVIDIA sulla presentazione.

Veicoli più sicuri con previsione dell’occupazione 3D

Mentre la tradizionale rilevazione degli oggetti in 3D – la rilevazione e la rappresentazione degli oggetti in una scena, spesso utilizzando scatole delimitatrici 3D – è un compito fondamentale nella percezione AV, ha i suoi limiti. Ad esempio, manca di espressività, il che significa che le scatole delimitatrici potrebbero non rappresentare informazioni sufficienti del mondo reale. Richiede anche la definizione di tassonomie e verità fondamentali per tutti gli oggetti possibili, anche quelli raramente visti nel mondo reale, come i pericoli stradali che potrebbero essere caduti da un camion.

Al contrario, la previsione dell’occupazione 3D fornisce informazioni dettagliate sul mondo allo stack di pianificazione di un veicolo a guida autonoma, che è necessario per la guida autonoma end-to-end.

I veicoli definiti dal software possono essere continuamente aggiornati con nuovi sviluppi che sono stati dimostrati e convalidati nel tempo. Aggiornamenti software all’avanguardia che derivano da iniziative di ricerca, come quelli riconosciuti presso CVPR, stanno consentendo nuove funzionalità e capacità di guida più sicure.

La piattaforma NVIDIA DRIVE offre un percorso per la produzione per i produttori automobilistici, fornendo hardware e software full-stack per lo sviluppo di AV sicuri e protetti, dalla macchina al data center.

Ulteriori informazioni sulla sfida CVPR

La sfida di previsione dell’occupazione 3D a CVPR ha richiesto ai partecipanti di sviluppare algoritmi che utilizzavano esclusivamente l’input della fotocamera durante l’inferenza. I partecipanti potevano utilizzare set di dati e modelli open source, facilitando l’esplorazione di algoritmi basati sui dati e modelli su larga scala. Gli organizzatori hanno fornito un sandbox di base per gli ultimi algoritmi di previsione dell’occupazione 3D all’avanguardia in scenari reali.

NVIDIA a CVPR

NVIDIA presenterà quasi 30 documenti e presentazioni a CVPR. Gli esperti che discuteranno la guida autonoma includono:

  • Jose Alvarez sulle sfide emergenti per la percezione 3D in AV durante il workshop End-to-End Autonomous Driving: Emerging Tasks and Challenges Workshop; e sull’ottimizzazione di grandi modelli profondi per l’inferenza in tempo reale presso l’Embedded Vision Workshop.
  • Nikolai Smolyanskiy, direttore del deep learning presso NVIDIA, sulla previsione del traffico in tempo reale per AV durante il workshop End-to-End Autonomous Driving: Perception, Prediction, Planning and Simulation.
  • Robin Jenkin, ingegnere distinto presso NVIDIA, sulla qualità dell’immagine nelle telecamere fisheye presso l’OmniCV Workshop, tenuto in congiunzione con CVPR.
  • Xinshuo Weng, scienziato di ricerca per la ricerca AV presso NVIDIA, sulle soluzioni di visione per la guida autonoma durante il Vision-Centric Autonomous Driving Workshop.

Guarda altre presentazioni all’agenda e scopri di più su NVIDIA a CVPR, che si svolgerà dal 18 al 22 giugno.

Immagine in primo piano cortesia di OccNet e Occ3D.