Un approccio di apprendimento automatico per prevedere lo stato di metilazione di MGMT nei pazienti affetti da glioblastoma

Approccio di apprendimento automatico per prevedere metilazione MGMT nei pazienti glioblastoma

Radiomica in Oncologia

Foto di National Cancer Institute su Unsplash

Introduzione

Oggi, esploreremo uno studio condotto su pazienti affetti da glioblastoma che è stato pubblicato sulla rivista Nature, Scientific Reports: Migliorare la previsione dello stato di metilazione MGMT del glioblastoma attraverso l’ottimizzazione delle caratteristiche radiomiche mediante approccio di apprendimento automatico basato su algoritmo genetico. Lo scopo di questo studio era cercare di prevedere lo stato di metilazione della O6-Metilguanina-DNA-metiltransferasi (MGMT). Il motivo per cui è importante essere in grado di prevedere questo stato è perché può essere un buon indicatore di quanto efficace sarà il trattamento chemioterapico con Temozolomide (TMZ).

Panoramica di Temozolomide

TMZ è un agente alchilante che funziona danneggiando il DNA nelle cellule tumorali, il che alla fine porta alla morte delle cellule. TMZ rende anche le cellule più sensibili alla radiazione. Questo è un fattore importante nel trattamento del cancro poiché la radioterapia viene utilizzata per aiutare a uccidere le cellule tumorali.

Questo studio si propone di trovare un nuovo modo per prevedere lo stato di metilazione della MGMT mediante apprendimento automatico. Se avrà successo, ciò potrà contribuire a ridurre alcune delle limitazioni tecniche e delle procedure invasive attualmente in uso per ottenere i campioni tumorali necessari per il test dello stato di metilazione.

È importante affrontare in modo efficiente ed efficace i tumori del glioblastoma (GBM) a causa della loro pericolosità per i pazienti che li sviluppano. Con una sopravvivenza mediana di 14-16 mesi, rappresentano circa il 45% di tutti i tumori maligni del sistema nervoso centrale.

Metodi

Questo team ha cercato di sfruttare un approccio a due fasi per prevedere lo stato di metilazione MGMT appropriato. Prima eliminando le caratteristiche radiomiche rumorose e poi implementando algoritmi di classificazione in un algoritmo genetico per identificare le migliori caratteristiche di previsione.

Sono state testate varie tecniche di apprendimento automatico durante questa ricerca. Lo scopo era trovare le caratteristiche radiomiche più significative per la previsione. Ciò è stato fatto estraendo le caratteristiche radiomiche dalle immagini multimodali ottenute dalle immagini a risonanza magnetica (MRI). Il metodo di selezione delle caratteristiche a due fasi è iniziato con un modello di eXtreme Gradient Boosting (XGBoost) seguito da un modello wrapper basato su algoritmo genetico (GA). I modelli GA funzionano in modo simile alla selezione naturale, in cui vengono identificate le migliori caratteristiche per le previsioni.

I dati utilizzati erano caratteristiche MRI multimodali preelaborate e segmentate dal The Cancer Genome Atlas. In totale, sono stati inclusi 53 pazienti affetti da GBM e sono state ottenute 704 caratteristiche radiomiche.

La fase di flusso di lavoro dell’algoritmo genetico consisteva in sei diverse fasi: generazione della popolazione iniziale, valutazione della fitness, selezione dei genitori, crossover, mutazione e sostituzione della popolazione per la generazione successiva. La formula utilizzata per la probabilità di selezione (in base alle prestazioni delle caratteristiche nello stadio di valutazione della fitness) è mostrata di seguito:

Formula di Probabilità di Selezione

Una volta estratte le caratteristiche iniziali dall’algoritmo XGBoost, è stato il momento di fare la classificazione utilizzando le caratteristiche per prevedere in quali classi rientrassero i pazienti con MGMT metilato e non metilato e utilizzarlo come valutazione della fitness. Sono stati implementati tre diversi algoritmi di apprendimento automatico nella fase di valutazione della fitness del flusso di lavoro dell’algoritmo genetico. Sono stati utilizzati Random Forest (RF), XGBoost e Support Vector Machines (SVM). Per implementare gli algoritmi, è stata utilizzata la libreria di apprendimento automatico SKlearn di Python.

Risultati

Dopo aver addestrato le tre diverse versioni di algoritmi, hanno valutato le prestazioni del modello con tre diverse misurazioni: accuratezza, specificità e recupero. Per confrontare le prestazioni, hanno utilizzato la media della cross-validazione eseguita 20 volte e hanno utilizzato un test di Kolmogorov-Smirnov per la valutazione.

Il miglior risultato è stato ottenuto dall’algoritmo Random Forest incorporato nell’Algoritmo Genetico (GA-RF). Questa tecnica ha superato gli altri in tutte le metriche di valutazione con un’accuratezza del 0,925, una sensibilità del 0,894 e una specificità del 0,966.

Dopo che il modello GA-RF è stato completato, è emerso un sottogruppo ottimale di 22 caratteristiche radiomiche. Tra queste caratteristiche sono incluse 17 caratteristiche testuali, 3 caratteristiche basate sull’istogramma, 1 caratteristica di volume e 1 caratteristica di intensità. Le caratteristiche testuali possono svolgere un ruolo di supporto per i medici riflettendo le correlazioni di intensità spaziale e le distribuzioni dei voxel che potrebbero aiutare a quantificare le “variazioni multiregionali” del flusso sanguigno, l’edema e la necrosi. Le caratteristiche dell’istogramma possono essere utilizzate per illustrare la distribuzione della frequenza dei valori di intensità che si verificano in un’immagine.

Caso d’uso ampliato

Per testare l’applicabilità più diffusa del modello, il team ha utilizzato le caratteristiche apprese su un nuovo set di dati. Il set di dati utilizzato questa volta riguardava pazienti con gliomi di basso grado (LGG). Hanno applicato direttamente le caratteristiche apprese e non hanno effettuato alcuna selezione aggiuntiva delle caratteristiche.

I risultati del modello GA-RF sul set di dati LGG sono stati un’accuratezza del 0,75, una sensibilità del 0,78 e una specificità del 0,62. Senza alcun trasferimento di apprendimento o messa a punto, questi sono risultati promettenti.

Ottendo una buona performance con le caratteristiche applicate al set di dati LGG, i ricercatori sono stati in grado di dimostrare che queste caratteristiche potrebbero essere potenzialmente riutilizzate per altre malattie simili.

Limitazioni

Una possibile limitazione di questa tecnica è che, con un numero ridotto di pazienti, i ricercatori possono incontrare un problema legato all’alta dimensionalità. Ciò accade quando il numero di caratteristiche è elevato rispetto alla quantità di dati di addestramento disponibili. Se ciò accade, può essere difficile apprendere relazioni accurate tra i dati e la variabile target.

I problemi di alta dimensionalità sono un problema diffuso nello spazio delle radiomiche, non solo in questo studio. Per superare questa limitazione, il team ha utilizzato la cross-validazione per essere più sicuro dei risultati ottenuti.

Panoramica della cross-validazione

La cross-validazione funziona suddividendo i dati utilizzati per l’addestramento e il test in gruppi diversi per ogni iterazione della convalida. Facendo ciò più volte e prendendo la media dei risultati, si ha maggiore fiducia che il modello possa ottenere ripetutamente i risultati che sta fornendo.

Nel trattamento del cancro, i medici si basano sulle caratteristiche e sul grado del tumore in modo da poter ottimizzare il trattamento con chemioterapia, radioterapia e chirurgia.

Conclusioni

Se questa tecnica continua a essere sviluppata e utilizzata in futuro, potrebbe rappresentare un modo per i medici di comprendere in modo non invasivo lo stato di metilazione del gene MGMT dei loro pazienti. Queste informazioni possono aiutarli a prendere decisioni di trattamento più informate che potrebbero portare a prognosi migliori per i pazienti. Ciò apre anche la porta ad altre potenziali modalità di utilizzo delle radiomiche in oncologia.

Do, D.T., Yang, MR., Lam, L.H.T. et al. Miglioramento della previsione dello stato di metilazione del gene MGMT nel glioblastoma mediante l’ottimizzazione delle caratteristiche radiomiche tramite un approccio di apprendimento automatico basato su algoritmo genetico. Sci Rep 12, 13412 (2022). https://doi.org/10.1038/s41598-022-17707-w

Eberhart, Karin, Ozlem Oral e Devrim Gozuacik. “Capitolo 13 – Induzione della morte cellulare autofagica da agenti antitumorali.” ScienceDirect, 2014, https://www.sciencedirect.com/topics/neuroscience/temozolomide#:~:text=Temozolomide%20(TMZ)%20is%20a%20small,damage%20and%20tumor%20cell%20death. Accesso il 12 luglio 2023.

Istituto Nazionale del Cancro. ‘Gli studi producono risultati che cambiano la pratica per il cancro al cervello’. Blog Cancer Currents, 9 giugno 2016, https://www.cancer.gov/news-events/cancer-currents-blog/2016/asco-temozolomide-brain. Accesso il 18 luglio 2023.

American Cancer Society. “Come funzionano i farmaci chemioterapici”. American Cancer Society, 22 novembre 2019, https://www.cancer.org/treatment/treatments-and-side-effects/treatment-types/chemotherapy/how-chemotherapy-drugs-work.html. Accesso il 25 luglio 2023.

Società Europea di Oncologia Medica. “Metilazione del promotore MGMT nel glioma: scheda informativa sui biomarcatori dell’ESMO.” Oncology Pro, [aggiornato il 18 gennaio 2019], https://oncologypro.esmo.org/education-library/factsheets-on-biomarkers/mgmt-promoter-methylation-in-glioma. Accesso il 9 luglio 2023.

Link alla licenza Creative Commons: https://creativecommons.org/licenses/by/4.0/