Predizione dell’incertezza basata sull’entropia

Uncertainty prediction based on entropy

Questo articolo esplora come l’entropia possa essere utilizzata come strumento per la stima dell’incertezza nei compiti di segmentazione delle immagini. Cammineremo attraverso cosa è l’entropia e come implementarla con Python.

Foto di Michael Dziedzic su Unsplash

Mentre lavoravo presso l’Università di Cambridge come scienziato della ricerca in neuroimaging e intelligenza artificiale, ho affrontato la sfida di eseguire la segmentazione delle immagini su complessi set di dati cerebrali utilizzando le più recenti tecniche di deep learning, in particolare nnU-Net. Durante questo impegno, ho osservato una significativa lacuna: la sottovalutazione della stima dell’incertezza. Tuttavia, l’incertezza è cruciale per una decisione affidabile.

Prima di addentrarci nei dettagli, sentiti libero di dare un’occhiata al mio repository Github che contiene tutti i frammenti di codice discussi in questo articolo.

L’importanza dell’incertezza nella segmentazione delle immagini

Nel mondo della computer vision e dell’apprendimento automatico, la segmentazione delle immagini è un problema centrale. Che si tratti di imaging medico, auto a guida autonoma o robotica, una segmentazione accurata è fondamentale per una decisione efficace. Tuttavia, un aspetto spesso trascurato è la misura dell’incertezza associata a queste segmentazioni.

Perché dovremmo preoccuparci dell’incertezza nella segmentazione delle immagini?

In molte applicazioni del mondo reale, una segmentazione errata potrebbe comportare conseguenze gravi. Ad esempio, se un’auto a guida autonoma identifica erroneamente un oggetto o un sistema di imaging medico etichetta erroneamente un tumore, le conseguenze potrebbero essere catastrofiche. La stima dell’incertezza ci fornisce una misura di quanto il modello sia “sicuro” della sua previsione, consentendo decisioni più informate.

Possiamo anche utilizzare l’entropia come misura dell’incertezza per migliorare l’apprendimento delle nostre reti neurali. Questa area è conosciuta come “apprendimento attivo”. Questa idea sarà esplorata in futuri articoli, ma l’idea principale è identificare le zone in cui i modelli sono più incerti per concentrarsi su di esse. Ad esempio, potremmo avere una CNN che esegue la segmentazione delle immagini mediche del cervello, ma che si comporta molto male su soggetti con tumori. Quindi potremmo concentrare i nostri sforzi per acquisire più etichette di questo tipo.