I Ricercatori di AI presso la Mayo Clinic introducono un metodo basato sull’apprendimento automatico per sfruttare i modelli di diffusione per costruire un algoritmo di inpainting multitask per i tumori cerebrali.

Ricercatori di AI Mayo Clinic usano apprendimento automatico per creare algoritmo multitask per tumori cerebrali.

Il numero di pubblicazioni sull’IA e, in particolare, sull’apprendimento automatico (ML) relative all’imaging medico è aumentato in modo significativo negli ultimi anni. Una ricerca attuale su PubMed utilizzando le parole chiave Mesh “intelligenza artificiale” e “radiologia” ha prodotto 5.369 articoli nel 2021, più del quintuplo dei risultati trovati nel 2011. I modelli di ML vengono costantemente sviluppati per migliorare l’efficienza e i risultati dell’assistenza sanitaria, dalla classificazione alla segmentazione semantica, alla rilevazione degli oggetti e alla generazione delle immagini. Numerosi rapporti pubblicati in radiologia diagnostica, ad esempio, indicano che i modelli di ML hanno la capacità di eseguire altrettanto bene o addirittura meglio degli esperti medici in compiti specifici, come la rilevazione delle anomalie e lo screening delle patologie.

È quindi innegabile che, se utilizzata correttamente, l’IA possa assistere i radiologi e ridurre drasticamente il loro lavoro. Nonostante l’interesse crescente nello sviluppo di modelli di ML per l’imaging medico, determinate sfide possono limitare le applicazioni pratiche di tali modelli o addirittura predisporli a significative distorsioni. La scarsità dei dati e l’inequilibrio dei dati sono due di queste sfide. Da un lato, i set di dati sull’imaging medico sono spesso molto più ridotti rispetto ai set di dati fotografici naturali come ImageNet, e raggruppare set di dati istituzionali o renderli pubblici potrebbe essere impossibile a causa delle preoccupazioni sulla privacy dei pazienti. D’altra parte, anche i set di dati sull’imaging medico a cui gli scienziati dei dati hanno accesso potrebbero essere più equilibrati.

In altre parole, il volume dei dati sull’imaging medico per pazienti con patologie specifiche è significativamente inferiore rispetto a quello dei pazienti con patologie comuni o persone in buona salute. Utilizzare set di dati insufficientemente grandi o sbilanciati per addestrare o valutare un modello di apprendimento automatico può comportare distorsioni sistemiche nelle prestazioni del modello. La generazione di immagini sintetiche è una delle strategie principali per affrontare la scarsità dei dati e l’inequilibrio dei dati, oltre alla pubblicazione di set di dati sull’imaging medico deidentificati e all’adozione di strategie come l’apprendimento federato, che consente lo sviluppo di modelli di apprendimento automatico (ML) su set di dati multi-istituzionali senza condivisione dei dati.

I modelli generativi di ML possono imparare a generare dati sull’imaging medico realistici che non appartengono a un paziente effettivo e possono quindi essere condivisi pubblicamente senza compromettere la privacy del paziente. Sono stati introdotti vari modelli generativi capaci di sintetizzare dati sintetici di alta qualità da quando sono emersi i generative adversarial networks (GAN). La maggior parte di questi modelli produce dati sull’imaging non etichettati, che possono essere utili in applicazioni specifiche, come modelli downstream auto-supervisionati o semi-supervisionati. Inoltre, alcuni altri modelli sono capaci di generazione condizionale, il che consente di generare un’immagine in base a variabili cliniche, testuali o di imaging predefinite.

I modelli di probabilità di diffusione del denoising (DDPM), noti anche come modelli di diffusione, sono una nuova classe di modelli di generazione di immagini che superano i GAN per quanto riguarda la qualità delle immagini sintetiche e la diversità degli output. Questa classe di modelli generativi consente la generazione di dati sintetici etichettati, che promuove la ricerca sull’apprendimento automatico, la qualità dell’imaging medico e l’assistenza ai pazienti. Nonostante il loro enorme successo nella generazione di dati sull’imaging medico sintetici, i GAN sono spesso criticati per la mancanza di diversità degli output e l’addestramento instabile. I modelli di apprendimento profondo dell’autoencoder sono un’alternativa più tradizionale ai GAN perché sono più facili da addestrare e producono output più diversi. Tuttavia, i risultati sintetici dei modelli autoencoder mancano della qualità delle immagini dei GAN.

I modelli di diffusione basati sulla teoria della catena di Markov imparano a generare i loro output sintetici mediante il denoising graduale di un’immagine iniziale con rumore gaussiano casuale. Questo processo iterativo di denoising rende i run di inferenza dei modelli di diffusione significativamente più lenti rispetto ad altri modelli generativi. Tuttavia, ciò consente loro di estrarre caratteristiche più rappresentative dai loro dati di input, consentendo loro di superare gli altri modelli. In questo articolo metodologico viene presentato un modello di diffusione a prova di concetto che può essere utilizzato per l’inpainting di tumori cerebrali multitask su studi di risonanza magnetica (MRI) cerebrale multi-sequenziali.

Hanno creato un modello di diffusione che può ricevere una fetta assiale bidimensionale (2D) da una sequenza di risonanza magnetica del cervello pesata in T1 (T1), pesata in T1 con contrasto (T1CE), pesata in T2 (T2) o FLAIR e inpaint un’area ritagliata definita dall’utente di quella fetta con un’immagine realistica e controllabile di un glioma di alto grado e dei suoi componenti corrispondenti (ad esempio, l’edema circostante) o di tessuti cerebrali senza tumore (apparentemente normali).

Negli Stati Uniti, l’incidenza del glioma di alto grado è di 3,56 su 100.000 persone e sono disponibili solo pochi set di dati sull’MRI per tumori cerebrali. Il loro modello consentirà ai ricercatori di ML di modificare (indurre o rimuovere) tessuti tumorali o senza tumore sintetici con caratteristiche configurabili su fette di MRI cerebrale con dati limitati. Lo strumento è stato pubblicato online per l’uso delle persone. Il modello è stato reso open-source insieme alla sua documentazione su GitHub.

Questo articolo è scritto come un articolo di sintesi di ricerca dallo Staff di Marktechpost basato sul paper di ricerca 'MULTITASK BRAIN TUMOR INPAINTING WITH DIFFUSION MODELS: A METHODOLOGICAL REPORT'. Tutti i crediti per questa ricerca vanno ai ricercatori di questo progetto. Dai un'occhiata al paper, al codice e al tool.
Per favore, non dimenticare di unirti al nostro subreddit di Machine Learning

Il post Ricercatori di Intelligenza Artificiale presso la Mayo Clinic presentano un metodo basato su Machine Learning per sfruttare i modelli di diffusione per costruire un algoritmo di inpainting multitask per tumori cerebrali è apparso per la prima volta su MarkTechPost.