Questa ricerca sull’IA ha sviluppato un metodo resistente ai rumori per rilevare i bordi degli oggetti senza un’immagine precedente.

Un metodo resistente ai rumori per rilevare i bordi degli oggetti senza un'immagine precedente la ricerca sull'IA che ha fatto la differenza.


Significativa attenzione nella computer vision si è concentrata nello sviluppo di algoritmi robusti ed efficienti per la rilevazione dei contorni. Le approcci per la rilevazione dei contorni, che spaziano dagli algoritmi tradizionali basati su operazioni differenziali fino ai più all’avanguardia basati su reti neurali, hanno contribuito in modo significativo alla sicurezza, al rilevamento ambientale e all’assistenza sanitaria. Poiché i metodi di elaborazione delle immagini recuperano le informazioni sui contorni, è necessaria la disponibilità di fotografie pre-completate dell’oggetto target per l’estrazione dei contorni convenzionale. Di conseguenza, il successo dell’identificazione dei contorni dipende dalla qualità dell’immagine di input. Tuttavia, le tecnologie ottiche standard hanno difficoltà a ottenere immagini nitide dell’oggetto target in ambienti complicati, come quelli con oggetti nascosti dietro la nebbia, l’acqua torbida e i tessuti biologici, soprattutto in scenari con forte inquinamento luminoso. La qualità della rilevazione dei contorni nell’immagine finale può essere compromessa come risultato.

La rilevazione dei contorni sensibile ai contorni a pixel singolo viene introdotta nello studio pubblicato in Intelligent Computing. Il nuovo metodo è particolarmente utile per rilevare correttamente i contorni degli oggetti nonostante il rumore quando è difficile acquisire buone immagini attraverso metodi ottici standard a causa di variabili come il forte inquinamento luminoso.

La fattibilità degli algoritmi di rilevazione dei contorni basati su SI è stata stabilita solo di recente. Senza un’immagine preliminare o un post-processing, viene fornito un metodo di estrazione dei contorni di alta qualità utilizzando la rilevazione dei contorni a pixel singolo sensibile ai contorni direttamente resistente al rumore (ESI). ESI illumina un oggetto con modelli di modulazione attentamente elaborati per estrarne i contorni. L’immagine a pixel singolo di Hadamard (HSI) prevede la proiezione di un insieme corrispondente di modelli di base di Hadamard su un singolo pixel per generare un’immagine completa di un oggetto. ESI ottiene modelli di modulazione ai margini dei modelli di base di Hadamard convolvendoli con operatori differenziali di secondo ordine. Questo approccio acquisisce direttamente spettri di Hadamard sensibili ai contorni dei contorni dell’oggetto per rilevare i contorni, evitando la necessità di qualsiasi immagine preesistente. ESI utilizza modelli di modulazione binari per velocizzare la rilevazione dei contorni e migliorare il rapporto segnale-rumore (SNR).

È stata sviluppata una tecnica di rilevazione dei contorni SESI, utilizzando la metà dei modelli di modulazione rispetto all’ESI ma rilevando comunque rapidamente i contorni. Di conseguenza, SESI può visualizzare i contorni nel tempo di metà, rendendo la rilevazione dei contorni basata su SI più pratica. Laplaciano e Laplaciano di Gaussiana (LoG) sono due esempi di operatori differenziali di secondo ordine comuni, e occupano la maggior parte della discussione qui. Sia le valutazioni teoriche che quelle pratiche confermano il loro impatto sui risultati delle simulazioni e degli esperimenti di rilevazione dei contorni. Nonostante il rumore di fondo significativo, questi test dimostrano che ESI e SESI possono estrarre direttamente contorni nitidi dalle immagini.

L’elaborazione computazionale sotto forma di SI viene utilizzata per adattare l’illuminazione della scena a un obiettivo specifico. In questa ricerca, i modelli di illuminazione sono stati creati tenendo presente l’obiettivo specifico della rilevazione dei contorni. L’elaborazione computazionale ottimizzata end-to-end, che crea anche modelli di illuminazione per un lavoro specifico (come la rilevazione dei contorni), è analoga a questo lavoro. I modelli di illuminazione per la rilevazione dei contorni sono creati utilizzando un modello matematico che è sia deterministico che interpretabile. Al contrario, i modelli di illuminazione ottimizzati end-to-end vengono immaginati utilizzando l’intelligenza artificiale basata sui dati, che di solito implica l’ottimizzazione. L’ottimizzazione end-to-end ha un alto livello per raggiungere una globalità ottimale. Questo studio si concentra solo sui modelli di illuminazione generati da una coppia di operatori differenziali di secondo ordine rappresentativi.

L’SI tradizionale acquisisce l’immagine di un oggetto proiettando i relativi modelli di base di modulazione e quindi utilizza una trasformazione inversa o una tecnica di ricostruzione dell’immagine tramite compressione per ricostruire l’immagine target.

I tipici modelli di immagini a pixel singolo di Hadamard sono state convolute utilizzando operatori differenziali di secondo ordine per creare i modelli di modulazione sviluppati dai ricercatori. L’immunità al rumore di questo metodo di rilevazione dei contorni differenziali è notevolmente migliorata, consentendo una rilevazione chiara e accurata dei contorni. Particolarmente impressionante è la capacità del metodo di rilevare i contorni in tempo reale, anche su oggetti in movimento, indicando la sua promessa per l’uso nei controlli di sicurezza nascosti negli spettri invisibili. La ricerca presenta anche una variante mono-round del nuovo metodo, che riduce il tempo di rilevazione a metà utilizzando meno modelli di modulazione per la rilevazione dei contorni. Nonostante questa semplificazione, il sistema utilizza comunque meno modelli di modulazione e ha un rapporto segnale-rumore più elevato rispetto a schemi di rilevazione dei contorni pubblicati in precedenza.

Attraverso la codifica preliminare dei modelli di modulazione, la nuova tecnologia può produrre risultati immediati in modo “privi di immagini”, consentendo un’ampia gamma di applicazioni nell’elaborazione delle immagini. Di conseguenza, il filtraggio omeomorfico e altre tecniche di elaborazione delle immagini possono essere incorporate con meno interferenze dal rumore di fondo. Miglioramenti futuri sono previsti per includere l’esplorazione dell’ottimizzazione end-to-end da parte dei ricercatori e l’ottimizzazione dei modelli di illuminazione utilizzati in questo lavoro.

È stato spiegato come gli operatori Laplaciano e LoG influenzino la resilienza degli schemi ESI. Studi di simulazione hanno mostrato che il Laplaciano ESI e il LoG ESI hanno una robustezza simile al rumore rispetto ai SNR, mentre il Laplaciano ESI ha bordi più nitidi. Le evidenze sperimentali sono state concordanti con i risultati simulati. Il LoG ESI ha creato bordi più ruvidi. La metodologia ESI proposta fornisce un metodo alternativo per recuperare l’immagine del bordo dell’oggetto, e l’idea che le tecniche convenzionali di elaborazione delle immagini possano essere pre-codificate in modelli di modulazione e quindi utilizzate per fornire risultati diretti senza una “immagine” è fornita come fonte creativa. Questa dimensione aggiuntiva è significativa poiché i modelli di modulazione pre-codificati sono immuni dalle interferenze e dai rumori nell’ambiente circostante. La pre-codifica è solo una delle molte tecniche di elaborazione delle immagini che potrebbero essere utilizzate per ottenere risultati migliori, tra cui il filtraggio omomorfico. I modelli di luce sviluppati in questo lavoro possono essere perfezionati e utilizzati come punto di partenza per un’ottimizzazione completa del sistema.