Sfide della produzione di massa di guida autonoma in Cina

Challenges of mass production of autonomous driving in China.

E i Recent Progress from Xpeng Motors nel 2023

Questo post del blog si basa sulla presentazione principale del workshop di guida autonoma end-to-end presso CVPR 2023 tenutosi a Vancouver, dal titolo “La pratica della guida autonoma di produzione di massa in Cina”.

La guida autonoma è una sfida difficile, soprattutto in Cina, dove la guida umana è già una delle più difficili al mondo. Ci sono tre fattori principali che entrano in gioco: partecipanti dinamici al traffico, struttura statica della strada e segnali stradali. In particolare, i segnali di controllo del semaforo rappresentano una sfida unica poiché sono statici nella geometria ma dinamici nella semantica. Nelle sessioni successive, esamineremo brevemente gli oggetti dinamici e gli ambienti statici, e approfondiremo l’interessante e speciale argomento del semaforo.

CVPR 2023 Autonomous Driving Workshop | OpenDriveLab

Siamo orgogliosi di annunciare quattro nuove sfide di marca quest’anno, in collaborazione con i nostri partner -Vision-Centric…

opendrivelab.com

Sfide dinamiche e statiche

I partecipanti dinamici al traffico, come gli utenti della strada vulnerabili (VRU), rappresentano una sfida significativa per i veicoli autonomi in Cina. I VRU sono spesso imprevedibili, assumendo diverse pose e apparendo dove i conducenti meno se lo aspettano. Animali di grandi dimensioni possono apparire improvvisamente su strade rurali, mentre gli animali domestici possono vagare per le strade urbane. Inoltre, i veicoli completamente carichi o i tricicli possono essere difficili da individuare il tipo di veicolo esatto. Consideriamo l’ultima foto nella riga centrale, in realtà è molto difficile anche per gli esseri umani riconoscere la scena a prima vista. Il veicolo, caricato con rami di albero, è involontariamente in perfetta mimetizzazione.

Diversi utenti della strada dinamici (grafico realizzato dall'autore)

Anche la struttura statica e la topologia della strada possono rappresentare una sfida significativa per i veicoli autonomi. Ad esempio, l’intersezione complessa mostrata qui evidenzia il livello di complessità che deve essere affrontato qui. Sebbene somigli a una schermata di un film di fantascienza, questa intersezione è, infatti, un luogo reale visibile su Google Earth.

Immagini satellitari di un'intersezione complessa (grafico realizzato dall'autore)

Se ingrandiamo, troveremo un interessante elemento stradale che è forse unico in Cina, l’Area di attesa per svoltare a sinistra. È progettato per aumentare il flusso di traffico per svoltare a sinistra, consentendo a più auto di attraversare l’incrocio in un ciclo di semaforo. Notare che il design potrebbe non essere simmetrico, e ogni direzione è progettata individualmente a seconda del modello di traffico. E possiamo anche trovare articoli accademici a riguardo e la sua efficacia. Anche se è stato proposto con buone intenzioni, potrebbe essere davvero confuso per i nuovi conducenti e il veicolo a guida autonoma.

Svoltare a sinistra in un incrocio con un’area di attesa comporta un processo in due fasi. Entrambi implicano diverse combinazioni di segnali luminosi. Qui ho mostrato solo il modello di semaforo più comune. La combinazione di semafori potrebbe essere più complessa, a volte coinvolgendo segnali luminosi speciali dedicati alle aree di attesa.

Le aree di attesa per svoltare a sinistra sono supportate da documenti scientifici (grafico realizzato dall'autore)

Il Re dei casi limite: i semafori

Ora possiamo approfondire tutti i casi limite dei semafori. I semafori sono forse la categoria di oggetti con il maggior numero di casi limite. La percezione dei semafori è complicata per due diverse ragioni. Prima dobbiamo riconoscere la posizione, il tipo e il colore del semaforo, poi dobbiamo anche sapere quale dei semafori rilevati, qui ne abbiamo sei, il nostro veicolo dovrebbe prestare attenzione. Per prendere questa decisione, è essenziale ottenere la corretta corrispondenza tra i semafori e le diverse corsie.

Una tipica scena di semafori in Cina (grafico creato dall'autore)

Un tipo speciale di luce sono i semafori progettati per gli autobus. Dobbiamo riconoscerli correttamente per due diverse ragioni. Innanzitutto, per la pianificazione e il controllo del veicolo, dobbiamo riconoscerli per ignorarli correttamente, poiché potrebbero portare informazioni in conflitto con le luci a cui dovremmo prestare attenzione e causare confusione per i nostri veicoli autonomi. Tuttavia, per prevedere come un potenziale autobus nelle vicinanze si muoverebbe, dobbiamo conoscere correttamente il suo stato.

Semaforo per autobus (grafico creato dall'autore)

I semafori progettati per gli autobus in Cina si presentano in molte forme, tra cui luci a LED con etichette come “BRT”, “SRT”, “Bus” o una singola lettera “B”. Possono anche presentare specifici caratteri cinesi come “公交” (autobus) o “有轨电车” (monorotaia), e talvolta includono icone raffiguranti un piccolo autobus carino. Accanto a queste caratteristiche, possono essere incluse anche modifiche ai segnali stradali, rendendo essenziale che i veicoli autonomi rilevino e riconoscano queste caratteristiche e le associino con precisione ai corrispondenti semafori.

Semaforo multicolore (grafico creato dall'autore)

Oltre ai semafori dedicati agli autobus, un altro tipo di semaforo complesso è il semaforo multicolore. A differenza dei tradizionali semafori stradali in cui solo una lampadina è accesa alla volta, i semafori multicolore possono avere più lampadine illuminate contemporaneamente nella stessa presa. Pertanto, non è sufficiente rilevare solo la scatola del semaforo; è altrettanto importante rilevare le singole lampadine e interpretarne il significato semantico con precisione.

Nell’immagine aggiuntiva del semaforo multicolore, vediamo anche alcuni numeri aggiuntivi. Sono timer di conto alla rovescia fino al cambio di colore successivo. Vediamo spesso i timer di conto alla rovescia per i pedoni in Nord America, ma questi timer sono destinati ai veicoli. Se questa informazione viene utilizzata correttamente, potrebbe essere utile per pianificare l’ottimizzazione della guida.

Semaforo per timer di conto alla rovescia (grafico creato dall'autore)

I timer di conto alla rovescia possono assumere diverse forme e essere presentati in modi diversi. Possono essere display autonomi o integrati con il sistema di semafori. Il formato delle cifre potrebbe variare, compreso l’uso o l’assenza di zeri iniziali, e i font utilizzati potrebbero differire, con alcuni più artistici di altri. Inoltre, ci sono anche semafori progettati nello stile di una barra di progresso. Questo comporta un’animazione in cui la barra di avanzamento si accorcia gradualmente prima di cambiare in una barra di progresso completa di colore diverso. Sebbene questo design possa essere considerato il più innovativo, può anche presentare sfide per i nostri ingegneri della percezione.

Semaforo per aree di attesa per svolta a sinistra (grafico creato dall'autore)

Infine, ecco i semafori dedicati alle aree di attesa, che possono assumere la forma di un’icona o di un testo. Quelli con icona prevedono anche tipicamente un’animazione, con le luci che si accendono gradualmente per guidarti all’area di attesa. Quelli con testo possono essere su display a LED o su segnali stradali. Per il testo, non esiste un modello standard, il che richiede il riconoscimento ottico dei caratteri (OCR) e un po’ di elaborazione del linguaggio naturale per estrarne il significato semantico.

XNGP: La soluzione di guida autonoma di Xpeng

Registrazioni di veicoli Xpeng prodotti in serie che compiono svolte a sinistra in modo automatico (video realizzato dall’autore)

Registrazione di veicoli Xpeng prodotti in serie che compiono svolte a destra in modo automatico (video realizzato dall’autore)

Nonostante queste sfide, il nostro team presso Xpeng è riuscito a fornire la soluzione di guida autonoma leader del mercato in Cina, a partire dal 2023. Il display Surround Reality (SR) mostra solo le informazioni ottenute dal sistema di percezione a bordo. A sinistra, il display rileva con precisione le geometrie della strada, mentre a destra rappresenta uno scenario comune in cui un gruppo di pedoni sta attraversando la strada. Vale la pena notare che le immagini mostrate rappresentano registrazioni effettive di veicoli Xpeng prodotti in serie che sono disponibili sul mercato oggi, senza alcuna modifica post-vendita.

Se sei interessato a come ciò sia stato possibile, consulta l’altro post sulla distribuzione di XNet – una pila di percezione end-to-end nel paradigma BEV (vista dall’alto). È il principale abilitatore per la soluzione di guida autonoma prodotta in serie sopra menzionata e getta le basi per una soluzione di guida autonoma completamente end-to-end.

La percezione BEV nella guida autonoma in produzione di massa

La ricetta di XNet, l’architettura di percezione BEV di Xpeng

Nisoo.com

Takeaways

  • Guidare in Cina è difficile a causa degli oggetti dinamici ubiquti, della complessa topologia stradale e dei casi estremamente rari di semafori.
  • I semafori hanno molti tipi speciali, ciascuno con molte eccezioni. A volte è necessario ragionare su più semafori insieme e anche con i timer del conto alla rovescia o i segnali di traffico nelle vicinanze.
  • Xpeng Motors ha affrontato queste sfide a testa alta e ha fornito il miglior prodotto di guida autonoma in produzione di massa in Cina, a partire dal 2023.

Riferimenti

  • Ma, Wanjing, et al. “Increasing the capacity of signalized intersections with left-turn waiting areas.” Transportation Research Part A: Policy and Practice 105 (2017): 181-196.