Ultima DXA-nazione

Ultima DXA-nazione

Modelli di intelligenza artificiale basati sull’immagine longitudinale per la salute e la medicina

L’AI può vedere la fine! L’apprendimento profondo prevede la mortalità per tutte le cause a partire da immagini di composizione corporea singole e sequenziali

L'imaging DXA offre molti tipi di visualizzazioni della composizione corporea. (Immagine dell'autore)

Punti chiave, TLDR:

  • La combinazione di immagini della composizione corporea e metadati (ad esempio, età, sesso, forza di presa, velocità di camminata, ecc.) ha prodotto le migliori previsioni di mortalità a 10 anni
  • I modelli longitudinali o sequenziali hanno in generale ottenuto risultati migliori rispetto ai modelli a singolo record, evidenziando l’importanza della modellazione dei cambiamenti e delle dipendenze temporali nei dati sulla salute.
  • I modelli longitudinali hanno il potenziale per fornire una valutazione più completa della salute di una persona
  • Leggi il paper

L’intelligenza artificiale (AI) e l’apprendimento automatico (ML) stanno rivoluzionando l’assistenza sanitaria, portandoci verso l’era della medicina di precisione. La motivazione per sviluppare modelli di intelligenza artificiale per la salute è quella di ridurre le morti e le malattie e prolungare una qualità di vita elevata. I modelli ben addestrati hanno la capacità di analizzare in modo più approfondito i dati presentati, offrendo una valutazione più completa della salute di una persona.

Modelli a singolo record vs modelli longitudinali

I modelli di intelligenza artificiale/apprendimento automatico basati sull’immagine medica hanno raggiunto una maturità tale da spesso eguagliare o addirittura superare le prestazioni umane, identificando abilmente modelli e anomalie che potrebbero sfuggire facilmente all’occhio umano. Tuttavia, la maggior parte di questi modelli opera ancora su dati di singolo istante temporale, fornendo un’istantanea isolata della salute in un momento specifico. Siano essi modelli unimodali o multimodali, tendono a lavorare con dati raccolti entro un periodo di tempo relativamente simile, costituendo la base di una previsione. Tuttavia, nel contesto più ampio dell’IA/ML per le applicazioni mediche, questi modelli a singolo istante rappresentano solo il primo passo, il cosiddetto “frutto facile”. Una frontiera della ricerca medica sull’IA sono i modelli longitudinali che offrono una visione più olistica della salute di una persona nel tempo.

I modelli longitudinali sono progettati per integrare dati provenienti da più istanti temporali, catturando la traiettoria di salute di un individuo anziché un momento isolato. Questi modelli sfruttano la natura dinamica della salute umana, in cui i cambiamenti fisiologici sono costanti. La capacità di mappare questi cambiamenti a esiti specifici o domande sulla salute potrebbe rappresentare una svolta nel settore dell’assistenza sanitaria predittiva. Il concetto di dati longitudinali non è nuovo nella pratica clinica: viene regolarmente utilizzato per monitorare l’invecchiamento e prevedere la fragilità. Un esempio importante è il monitoraggio della densità minerale ossea (DMO), un marcatore chiave per l’osteoporosi e la fragilità. Valutazioni regolari della DMO possono rilevare diminuzioni significative, indicando potenziali rischi per la salute.

Sfide nello sviluppo di modelli longitudinali

Storicamente, lo sviluppo di modelli longitudinali ha affrontato diverse sfide significative. Oltre ai volumi di dati più grandi e al calcolo richiesto per singolo individuo, l’ostacolo più critico risiede nella curatela dei dati medici longitudinali stessi. A differenza dei dati di singolo istante temporale, i dati longitudinali coinvolgono il monitoraggio delle informazioni sulla salute dei pazienti per periodi prolungati, spesso presso diverse istituzioni sanitarie. Ciò richiede un’organizzazione e una gestione meticolose dei dati, rendendo il processo di curatela sia lungo che costoso. Sono stati finanziati diversi studi di successo per raccogliere prospectivamente dati longitudinali. Questi studi riportano sfide legate alla conservazione del paziente per un periodo di osservazione più lungo. Pertanto, nonostante i potenziali benefici dei modelli longitudinali, il loro sviluppo è rimasto un’impresa complessa e intensiva in termini di risorse.

Obiettivo

I cambiamenti nella composizione corporea, le proporzioni di tessuto adiposo magro e grasso e l’osso sono noti per essere associati alla mortalità. Nel nostro studio, abbiamo cercato di utilizzare le informazioni sulla composizione corporea per prevedere in modo più accurato la mortalità per tutte le cause, in termini più semplici, la probabile linea temporale della vita di una persona. Abbiamo valutato le prestazioni di modelli costruiti sia su dati di singolo istante temporale che longitudinali, rispettivamente denominati “record singolo” e “sequenziali”. I modelli a singolo istante temporale ci hanno permesso di valutare quale tipo di informazione fosse più predittiva della mortalità. Lo sviluppo dei modelli sequenziali è stato finalizzato a catturare i cambiamenti nel tempo e valutare come ciò influisce sulle previsioni di mortalità.

I Dati

I dati per questo studio sono stati acquisiti da uno studio longitudinale noto come lo studio Health, Aging, and Body Composition (Health ABC), nel quale sono stati seguiti e monitorati oltre 3000 adulti anziani di diversa razza per un massimo di 16 anni. Questo studio ha prodotto un ricco e completo set di dati longitudinali. Come parte di questo studio, ai pazienti è stata effettuata una scansione TBDXA (Dual-energy X-ray Absorptiometry) dell’intero corpo e sono state raccolte diverse informazioni meta-dati (vedi tabella XXX). In conformità alle migliori pratiche di modellazione e per evitare perdite di dati o sovradattamento, i dati sono stati suddivisi in un set di addestramento, di validazione e di test, utilizzando una suddivisione del 70%/10%/20%.

Noi quantifichiamo la composizione corporea utilizzando la scansione TBDXA (Dual-energy X-ray Absorptiometry) dell’intero corpo, che da lungo tempo è considerata una metodologia di imaging di riferimento. Storicamente, i meta-dati dei pazienti, che includono variabili come l’età, l’indice di massa corporea (BMI), la forza di presa, la velocità di camminata, ecc., sono stati utilizzati per valutare l’invecchiamento/la mortalità e come misura surrogata della composizione corporea. L’uso diffuso dei meta-dati dei pazienti e delle misure surrogate della composizione corporea era dovuto alla limitata accessibilità degli scanner DXA. L’accessibilità è notevolmente migliorata di recente, con scansioni che sono diventate più economiche e non richiedono più un riferimento/ordine/prescrizione medica.

Modello a Immagine Singola

Sono stati costruiti tre modelli a record singolo, ognuno con input dati diversi ma tutti con la stessa uscita, che è una probabilità di mortalità a 10 anni. Il primo modello è stato costruito per utilizzare solo i meta-dati dei pazienti ed è una rete neurale con un unico strato nascosto di attivazione ReLU a 32 unità e un livello di previsione sigmoide. Il secondo modello utilizzava solo le immagini TBDXA come input ed era costituito da un Densenet121 modificato per gestire i due canali di colore anziché i tre canali di colore (RGB) presenti nella maggior parte delle immagini naturali. La natura a doppia energia della DXA produce immagini ad alto e basso dosaggio di raggi X, che vengono interamente registrate e impilate in due canali di immagine. Il terzo modello combina l’embedding dei meta-dati del modello uno con l’embedding delle immagini TBDXA del modello due, quindi lo passa attraverso uno strato completamente connesso ReLU di 512 unità e uno strato di previsione sigmoide.

Diagramma degli input dati, delle architetture dei modelli e dei metodi per i modelli a record singolo (Immagine degli autori)

Modello Longitudinale/Sequenziale

Sono stati costruiti e valutati tre modelli sequenziali. Le architetture dei modelli a record singolo hanno servito come base per ciascun modello sequenziale, ma i livelli di previsione sigmoide sono stati rimossi in modo che l’uscita fosse un vettore che rappresenta gli embedding delle caratteristiche. Nel corso dello studio, sono stati raccolti dati da ciascun paziente in diversi momenti temporali. I dati di ciascun momento sono stati inseriti nei modelli appropriati per ottenere il vettore delle caratteristiche corrispondente. I vettori delle caratteristiche per ciascun paziente sono stati ordinati e impilati in una sequenza. Un modello Long Short Term Memory (LSTM) è stato addestrato per prendere la sequenza di vettori delle caratteristiche e produrre una previsione di mortalità a 10 anni. Come precedentemente menzionato, ci sono diverse difficoltà nell’effettuare studi a lungo termine, con la trattenzione e la raccolta dei dati che rappresentano un problema comune. Il nostro studio non è stato esente da questi problemi e alcuni pazienti hanno avuto più punti dati rispetto ad altri come risultato. È stato scelto un modello LSTM come approccio di modellazione sequenziale perché non sono vincolati a utilizzare la stessa lunghezza di sequenza di input per ciascun paziente. In altre parole, gli LSTM possono lavorare con sequenze di lunghezza variabile, eliminando così la necessità di riempire le sequenze se i pazienti avevano meno punti dati (~10).

Diagramma degli input dati, delle architetture dei modelli e dei metodi per i modelli sequenziali (Immagine degli autori)

Vincitori dei Modelli Longitudinali con Immagini + Meta-dati

L’area sotto la curva caratteristica di operazione del ricevitore (AUROC) sul set di test hold-out mostra che i meta-dati hanno prestazioni migliori rispetto all’uso delle sole immagini TBDXA sia nei modelli a record singolo che nei modelli sequenziali. Tuttavia, la combinazione di meta-dati e immagini TBDXA ha prodotto i migliori AUROC in entrambi i paradigmi di modellazione, il che indica che le immagini contengono informazioni utili, predictive della mortalità, che non vengono catturate dai meta-dati. Un altro modo di interpretare ciò è che i meta-dati non rappresentano una misura surrogata completa della composizione corporea per quanto riguarda la previsione della mortalità. Se fossero stati surrogati completi, la combinazione di immagini TBDXA con i meta-dati non avrebbe comportato un aumento o un cambiamento significativo nell’AUROC. Il fatto che la combinazione abbia prodotto migliori AUROC indica che le immagini forniscono informazioni ortogonali oltre a quelle catturate dai meta-dati e giustifica ulteriormente l’utilità delle immagini.

Performance AUC dei modelli di record singolo e sequenziali (Immagine degli autori)

I modelli longitudinali o sequenziali hanno mostrato una migliore performance rispetto ai modelli di record singolo. Questo è vero per tutti gli approcci di modellizzazione e i tipi di dati di input (meta-dati, solo immagine, meta-dati combinati e immagine). Questi risultati dimostrano l’importanza della modellizzazione dei cambiamenti e delle dipendenze temporali dei dati sanitari.

Abbiamo effettuato un’analisi di Miglioramento dell’Discriminazione Integrata (IDI) per valutare i benefici della combinazione di immagini con i metadati, rispetto all’utilizzo solo dei metadati. Questa analisi è stata condotta sui modelli sequenziali, che hanno superato i modelli di record singolo. L’IDI è risultato essere 5.79, con una sensibilità e specificità integrate rispettivamente pari a 3.46 e 2.33. Ciò indica che la combinazione di immagini e metadati migliora la capacità del modello di identificare correttamente coloro che non sopravviveranno nei prossimi 10 anni del 3.46%, e migliora la capacità di identificare correttamente coloro che sopravviveranno nei prossimi 10 anni del 2.33%. Complessivamente, ciò suggerisce un miglioramento delle prestazioni del modello di circa il 5.8%.

Risultati dell'analisi di Miglioramento dell'Discriminazione Integrata (IDI) (Immagine degli autori)

E allora?

Il nostro studio sottolinea il promettente potenziale dei modelli di intelligenza artificiale/apprendimento automatico longitudinali nel campo della previsione della salute, in particolare nel contesto della mortalità per tutte le cause. L’analisi comparativa tra i modelli di record singolo e i modelli longitudinali ha rivelato che quest’ultimi offrono prestazioni superiori, indicando il ruolo critico della modellizzazione dei cambiamenti nel tempo nell’analisi dei dati sanitari. Le implicazioni cliniche delle nostre scoperte includono la capacità di fornire una valutazione più precisa e olistica della salute di una persona attraverso modelli che tengono conto dei dati storici o longitudinali del paziente. Sebbene i dati necessari per lo sviluppo di modelli di salute longitudinali esistano, l’infrastruttura adeguata e il supporto istituzionale non sono ancora orientati a consentire un’efficace curatela dei dati e lo sviluppo di questi modelli su larga scala. Tuttavia, molti stanno lavorando per superare queste difficoltà e lo sviluppo di modelli longitudinali è una delle tante frontiere interessanti per l’intelligenza artificiale in medicina.

Le implicazioni cliniche di queste scoperte sono estese. I modelli longitudinali hanno il potenziale per trasformare la fornitura di cure, consentendo previsioni più precise e personalizzate sulla traiettoria di salute di un paziente. Tali modelli possono informare interventi proattivi, migliorando così gli esiti delle cure e, eventualmente, prolungando la vita. Inoltre, l’uso sia dei metadati che dei dati delle immagini stabilisce un nuovo precedente per i futuri modelli di intelligenza artificiale/apprendimento automatico, suggerendo un approccio sinergico per risultati ottimali. Rafforza la necessità di dati multidimensionali e sfumati per dipingere un quadro accurato e olistico della salute di un paziente. Queste scoperte rappresentano progressi significativi nell’applicazione dell’intelligenza artificiale/apprendimento automatico nella sanità, evidenziando un percorso entusiasmante nel nostro perseguimento della medicina di precisione.

Ulteriori risorse:

Leggi l’articolo

Deep learning prevede la mortalità per tutte le cause dall’imaging DXA del corpo totale longitudinale…

La ricerca sulla mortalità ha identificato biomarcatori predittivi del rischio di mortalità per tutte le cause. La maggior parte di questi marker, come…

www.nature.com

Ulteriori informazioni sull’IDI ed esempi pubblicati:

Area Under the Curve e oltre

Medici e scienziati dei dati, ecco un’introduzione all’IDI e all’NRI con un esempio codificato in Python. Gli AUC potrebbero non essere sempre sufficienti…

towardsdatascience.com

Imaging mammario a tre compartimenti a doppia energia per biomarcatori compositivi per migliorare la rilevazione di…

Mentre le immagini mammografiche del seno come la mammografia digitale a campo pieno e la tomosintesi del seno digitale hanno contribuito a ridurre…

www.nature.com

GitHub – LambertLeong/AUC_NRI_IDI_python_functions: Funzioni personalizzate in Python per aiutarti ulteriormente…

Funzioni personalizzate in Python per aiutarti ulteriormente ad analizzare modelli di apprendimento automatico e test diagnostici – GitHub…

github.com

Area Under the Curve e oltre con miglioramento dell’indice di discriminazione integrato e riclassificazione netta

Medici e scienziati dei dati, ecco un’introduzione a IDI e NRI con un esempio codificato in Python. Le AUC potrebbero non essere sempre sufficienti…

www.lambertleong.com