Incontra TxGNN un nuovo modello che utilizza l’apprendimento profondo geometrico e l’intelligenza artificiale centrata sull’essere umano per fare previsioni senza addestramento sull’uso terapeutico attraverso una vasta gamma di 17.080 malattie.

Incontra TxGNN, un nuovo modello che utilizza l'apprendimento profondo geometrico e l'intelligenza artificiale centrata sull'essere umano per fare previsioni sull'uso terapeutico di un'ampia gamma di 17.080 malattie senza addestramento.

C’è un urgente bisogno di creare terapie per soddisfare le esigenze sanitarie di miliardi di persone in tutto il mondo. Tuttavia, solo una piccola frazione delle malattie riconosciute clinicamente ha attualmente trattamenti autorizzati. Le alterazioni della funzione genica e delle molecole che producono sono cause comuni di malattia. I farmaci che possono ripristinare le normali attività molecolari sono una potenziale difesa contro queste malattie. Purtroppo, gli approcci terapeutici per ripristinare le attività biologiche dei geni danneggiati sono ancora difficili da ottenere per molte patologie. Inoltre, la maggior parte delle malattie è causata da modifiche in molti geni e gli individui possono avere pattern di mutazione molto diversi anche all’interno di un singolo gene. Gli interactomi, o reti di geni che partecipano ai processi e alle attività associati alle malattie, sono un ottimo strumento per spiegare questi eventi genetici. Per decifrare l’architettura genetica alterata nelle malattie e aiutare nella creazione di farmaci mirati ad essa, l’apprendimento automatico è stato utilizzato per analizzare gli interactomi molecolari ad alta velocità e i dati delle cartelle cliniche elettroniche.

Lo sviluppo di nuovi farmaci è una sfida, specialmente per le malattie con poche opzioni di trattamento, ma può sostituire farmaci inefficaci con altri più sicuri ed efficaci. La FDA autorizza trattamenti solo per 500 delle centinaia di malattie umane. Solo 1.363 dei 17.080 disturbi riconosciuti clinicamente inclusi nell’analisi avevano farmaci specificamente prescritti per loro; di questi, 435 avevano solo una prescrizione, 182 ne avevano due e 128 ne avevano tre. Trovare nuovi farmaci è terapeuticamente significativo, anche per le malattie con terapie. Fornisce più opzioni di trattamento con minori effetti avversi e sostituisce farmaci inefficaci in determinate popolazioni di pazienti.

TXGNN, una tecnica di apprendimento profondo geometrico per la previsione dell’uso terapeutico, è stata introdotta da ricercatori interessati a malattie per le quali è necessaria una maggiore conoscenza delle loro cause molecolari e dei potenziali trattamenti. TXGNN viene insegnato utilizzando un grafo centrato sulla terapia che viene stratificato con reti malate attualmente in trattamento. Questo grafo della conoscenza integra e compila decenni di studi biologici su 17.080 malattie comuni e non comuni. È ottimizzato per riflettere la geometria del grafo centrato sulla terapia di TXGNN. Un modello di rete neurale a grafo integra i candidati terapeutici e le malattie in uno spazio di rappresentazione latente. TXGNN utilizza un modulo di apprendimento metrico che funziona nello spazio di rappresentazione latente e può trasferire il modello di TXGNN dalle malattie viste durante l’addestramento alle malattie trascurate per evitare la limitazione dell’apprendimento profondo supervisionato nella previsione dell’uso terapeutico per le malattie trascurate.

TxGNN è una rete neurale a grafo preaddestrata su un grafo della conoscenza che include 17.080 disturbi riconosciuti clinicamente e 7.957 candidati al trattamento. Può svolgere diverse attività terapeutiche in una formulazione unificata. L’infierenza “zero-shot” su malattie non addestrate è possibile con TxGNN poiché non richiede il fine-tuning delle etichette dei dati di riferimento o parametri extra dopo l’addestramento. Rispetto agli approcci all’avanguardia, TxGNN supera significativamente la concorrenza, con un aumento dell’accuratezza fino al 49,2 percento per le attività di indicazione e al 35,1 percento per le attività di controindicazione.

Progettazione sperimentale e metodologia – Suddivisione dei set di dati per una valutazione delle prestazioni completa

  • Suddivisioni delle aree delle malattie:

Molte malattie hanno potenziale terapeutico ma non hanno terapie efficaci e una scarsa comprensione biologica. Il potenziale di TXGNN per prevedere le connessioni farmaco-malattia in tali casi viene testato simulando malattie ben studiate come se fossero molecolarmente non caratterizzate utilizzando divisioni dei dati sviluppate dal team di studio.

Innanzitutto, le malattie del gruppo e i relativi collegamenti farmaco-malattia vengono copiati nel set di test. Ciò significa che durante l’addestramento, TXGNN è all’oscuro dell’esistenza dei collegamenti che rappresentano le indicazioni e le controindicazioni attuali per la categoria di malattie selezionata. Questo simula la difficoltà di trattare disturbi con meccanismi biologici sottostanti sconosciuti.

  • Suddivisioni sistematiche del set di dati:

Prevedere malattie non trattabili dovrebbe adattarsi perfettamente al modello di apprendimento automatico in fase di implementazione. È molto più semplice prevedere terapie potenziali per malattie che hanno già trattamenti rispetto a quelle che non li hanno. I ricercatori hanno ideato questa suddivisione per indagare rigorosamente la capacità del modello di prevedere malattie precedentemente sconosciute. I ricercatori hanno iniziato dividendo tutte le malattie in modo casuale. Quando durante l’addestramento non sono riconosciute terapie e il set di test comprende malattie uniche, i ricercatori trasferiscono tutti i collegamenti farmaco-malattia associati al set di test. Ogni iterazione del set di test include oltre cento malattie uniche.

  • Suddivisioni dei dati incentrate sulle malattie:

I ricercatori utilizzano una valutazione incentrata sulle malattie per modellare come i candidati ai farmaci potrebbero essere utilizzati in clinica. Innanzitutto, i ricercatori collegano tutti i farmaci nel KG con tutte le malattie nel set di test, escludendo le associazioni farmaco-malattia nel set di addestramento. Successivamente, i ricercatori valutano tutte le coppie possibili in base alla probabilità con cui interagiscono tra loro. I ricercatori calcolano quindi il richiamo recuperando i primi K farmaci (cioè quanti farmaci e malattie nel set di test sono nel K completo). L’ultimo passo consiste nell’ottenere una linea guida casuale di screening, in cui i primi K farmaci nel set di farmaci vengono campionati casualmente e viene calcolato il richiamo.

Risultati

  • Predizione delle applicazioni terapeutiche utilizzando priorità biologiche geometriche in TXGNN. TXGNN si basa sull’ipotesi che i farmaci che mirano alle reti disturbate dalla malattia nell’interattoma delle proteine avranno la maggior possibilità di successo. Ottimizzato per catturare la geometria del grafo di conoscenza di TXGNN, TXGNN è un GNN ancorato alla conoscenza che mappa i candidati al trattamento e i disturbi (concetti di malattia) nello spazio di rappresentazione latente.
  • Utilizzo di un riferimento TXGNN per la predizione dell’applicazione terapeutica a zero-shot. I ricercatori testano la capacità di TXGNN di prevedere indicazioni e controindicazioni. Poiché TXGNN è destinato a trattare malattie come la malattia di Stargardt16 e l’iperossaluria, per le quali attualmente non esistono trattamenti, le sue prestazioni vengono misurate utilizzando una metrica chiamata prestazioni a zero-shot, in cui al modello viene chiesto di prevedere l’uso terapeutico per malattie in un set di dati separato noto come set di hold-out (test) che non è stato visto durante l’addestramento del modello.
  • Precisione del 100% nella previsione dell’uso terapeutico per cinque tipi di malattie. Terapie simili potrebbero essere utilizzate per disturbi che hanno basi biologiche simili.
  • Incapacità di prevedere l’uso terapeutico nei pazienti che rifiutano regolarmente il trattamento.
  • Precisione del 100% rispetto a 1.363 disturbi per i quali ci sono indicazioni e 1.195 condizioni per le quali ci sono controindicazioni.
  • Prestare attenta considerazione a quali trattamenti sono raccomandati e quali sono controindicati.
  • Confronto delle prognosi di TXGNN con le opzioni di trattamento attuali. I ricercatori hanno preso in considerazione 10 nuovi medicinali autorizzati dopo che i dati e lo sviluppo del modello di TXGNN erano completi per dimostrare che TXGNN non è guidato dal bias di conferma. Nel dataset di TXGNN, non ci sono nodi di farmaco-malattia collegati direttamente. È stato quindi chiesto a TXGNN di fornire previsioni ai ricercatori.

Caratteristiche

  • Riguardo ai disturbi per i quali non esistono medicinali e la nostra conoscenza molecolare è scarsa, TXGNN ha una capacità predittiva “zero-shot” per l’uso terapeutico.
  • Nonostante il limite pratico di non conoscere medicinali per una specifica condizione e la necessità di estrapolare in una nuova area di malattia non osservata durante l’addestramento, TXGNN può migliorare notevolmente la predizione dell’uso terapeutico in vari disturbi.
  • Inoltre, le terapie previste da TXGNN mostrano un elevato grado di correlazione con i dati provenienti da cartelle cliniche elettroniche effettive, e possono essere utilizzate per testare contemporaneamente un gran numero di ipotesi terapeutiche localizzando coorti di malattie che sono state o non sono state prescritte un particolare farmaco utilizzando popolazioni di pazienti seguiti per diversi anni.
  • Le previsioni di TXGNN sono state presentate a un gruppo di medici, e il pubblico ha potuto apprendere di più sul modello auto-esplicativo utilizzato da TXGNN per trattare le malattie. L’importanza del design centrato sul clinico nel passaggio dell’apprendimento automatico dallo sviluppo all’implementazione biomedica è evidenziata dai risultati di uno studio di usabilità che mostra come i ricercatori utilizzando l’interattivo TXGNN Explorer possano riprodurre modelli di apprendimento automatico e identificare e risolvere più facilmente i punti di fallimento dei modelli.