Incontra Med-PaLM Multimodal (Med-PaLM M) un grande modello generativo multimodale che codifica e interpreta in modo flessibile i dati biomedici.

Incontra Med-PaLM M, un grande modello generativo multimodale per dati biomedici.

I modelli di linguaggio di grandi dimensioni (LLM) si sono evoluti in quasi tutti i settori, dalla sanità e finanza all’istruzione e ai social media. I clinici nel settore medico si affidano a una vasta gamma di fonti di dati per fornire cure di alta qualità. In questa categoria di informazioni sono inclusi tipi di dati come note cliniche, risultati di laboratorio, segni vitali e osservazioni, fotografie mediche e dati genomici. Nonostante ci siano stati continui sviluppi nel campo dell’Intelligenza Artificiale biomedica (AI), la maggior parte dei modelli di AI utilizzati oggi sono limitati a lavorare su un singolo compito e ad analizzare dati da una singola modalità.

I noti modelli di base offrono l’opportunità di trasformare completamente l’AI medica e questi modelli vengono adattati a diverse attività e ambienti attraverso l’apprendimento in contesto o il fine-tuning con pochi esempi, in quanto vengono addestrati su enormi quantità di dati utilizzando obiettivi di apprendimento auto-supervisionato o non supervisionato. Attualmente si stanno sviluppando sistemi unificati di AI biomedica in grado di comprendere dati provenienti da diverse modalità con strutture complesse per gestire una varietà di difficoltà mediche. Si prevede che tali modelli avranno un impatto su tutto, dalla ricerca biomedica di base al trattamento dei pazienti.

I ricercatori si stanno impegnando nella creazione di un sistema di AI biomedica a uso generale. Per agevolare lo sviluppo di questi sistemi di AI biomedica generalisti, un team di ricercatori di Google Research e Google DeepMind ha introdotto MultiMedBench, una particolare benchmark composta da 14 diverse attività biomediche, per contribuire allo sviluppo di questi sistemi di AI biomedica. Queste attività coprono una serie di difficoltà, tra cui rispondere a domande mediche, analizzare immagini dermatologiche e mammografiche, creare e riassumere rapporti radiologici e identificare variazioni genomiche.

Gli autori hanno anche fornito una prova di concetto chiamata Med-PaLM Multimodal (Med-PaLM M), un modello generativo multimodale di grandi dimensioni in grado di comprendere e codificare molti tipi di dati biomedici, come il linguaggio clinico, le immagini mediche e i dati genetici, con diversi livelli di flessibilità. Rispetto ai modelli all’avanguardia, Med-PaLM M ha ottenuto prestazioni competitive o addirittura superiori su tutti i compiti coperti nella valutazione MultiMedBench. Med-PaLM M ha addirittura mostrato prestazioni notevolmente migliori in molti casi rispetto a modelli specializzati.

Il team ha anche condiviso alcune capacità uniche di Med-PaLM M. Hanno fornito evidenze della capacità del modello di apprendimento di trasferimento positivo tra i compiti e di generalizzazione senza bisogno di addestramento specifico a concetti e compiti medici. Il sistema di AI mostra una capacità emergente di ragionamento medico senza bisogno di addestramento specifico. Nonostante questi risultati incoraggianti, il team ha sottolineato che è necessario fare ulteriori lavori prima che questi sistemi di AI biomedica generalisti possano essere utilizzati in ambienti pratici. Tuttavia, i risultati pubblicati rappresentano un notevole passo avanti per questi sistemi e offrono prospettive incoraggianti per la futura creazione di soluzioni mediche basate su AI.

Il team ha riassunto i contributi nel seguente modo.

  1. Questo lavoro dimostra il potenziale dei sistemi di AI biomedica generalisti per applicazioni mediche, anche se l’accesso a estesi dati biologici per l’addestramento e la convalida delle prestazioni in uso continua a essere un problema.
  1. MultiMedBench comprende 14 compiti unici che coprono una serie di modalità biomediche. È stato introdotto Med-PaLM M, il primo sistema di AI biomedica generalista multitasking che non richiede modifiche specifiche per compiti specifici.
  1. Il sistema di AI dimostra capacità emergenti, come la generalizzazione a nuovi concetti medici e il ragionamento medico senza bisogno di addestramento specifico.
  1. Viene indicata l’utilità clinica potenziale da una revisione umana degli output di Med-PaLM M, in particolare nella produzione di rapporti di radiografia del torace.
  1. Con un basso numero medio di errori, i radiologi preferiscono i rapporti di Med-PaLM M rispetto ai rapporti dei radiologi in fino al 40,50% dei casi.