MLCommons presenta MedPerf Una piattaforma open-source per il benchmarking dei modelli di intelligenza artificiale al fine di fornire efficacia clinica

MLCommons presenta MedPerf, una piattaforma open-source per benchmarking AI al fine di fornire efficacia clinica.

Valutare l’efficacia dei modelli di intelligenza artificiale su ampi e variegati set di dati del mondo reale è essenziale per la traduzione clinica dell’intelligenza artificiale medica. MedPerf, una piattaforma di benchmarking aperta, è stata annunciata da MLCommons, una comunità ingegneristica aperta a livello mondiale, per valutare in modo efficace i modelli di intelligenza artificiale su una vasta gamma di dati medici del mondo reale al fine di fornire efficacia clinica, proteggendo al contempo la privacy dei pazienti e riducendo al minimo le preoccupazioni legali e regolamentari.

I modelli di intelligenza artificiale medica possono sviluppare un involontario pregiudizio nei confronti di determinate popolazioni di pazienti se addestrati su dati provenienti da un piccolo sottoinsieme di impostazioni cliniche possibili. A causa della sua incapacità di generalizzare, l’intelligenza artificiale medica può avere meno effetto nel mondo reale. Tuttavia, a causa di considerazioni sulla privacy, legali e regolamentari, i proprietari dei dati sono restii a concedere l’accesso a set di dati più ampi e diversificati per l’addestramento dei modelli. MedPerf potenzia l’intelligenza artificiale medica eliminando il pregiudizio e aumentando la generalizzabilità e l’impatto clinico rendendo i dati provenienti da tutto il mondo comodamente e in modo sicuro accessibili ai ricercatori di intelligenza artificiale. 

Senza accesso ai dati dei pazienti, MedPerf consente alle organizzazioni sanitarie di valutare e convalidare i modelli di intelligenza artificiale in modo agevolato e supervisionato dall’uomo. I modelli di intelligenza artificiale medica vengono installati e revisionati in remoto presso i fornitori di dati, una funzionalità resa possibile dalla valutazione federata della piattaforma. Le preoccupazioni sulla privacy delle informazioni dei pazienti vengono alleviate e la fiducia viene rafforzata, tutto ciò contribuisce a una migliore cooperazione tra gli stakeholder sanitari.

La capacità di MedPerf di orchestrare la valutazione di numerosi modelli di intelligenza artificiale con gli stessi collaboratori ci consente di farlo in ore anziché mesi. Questa efficacia è stata dimostrata nell’esperimento federato più grande sulla glioblastoma, la Federated Tumor Segmentation (FeTS) Challenge. La sfida FeTS ha utilizzato MedPerf per valutare 41 modelli distinti in 32 siti su 6 continenti.

Inoltre, una serie di prove pilota riflettenti la ricerca medica accademica ha confermato l’efficacia di MedPerf. La segmentazione dei tumori cerebrali, del pancreas e delle fasi di un flusso di lavoro chirurgico sono solo alcuni degli argomenti trattati in queste indagini in loco e basate su cloud. I risultati confermano che i benchmark di valutazione federata aiutano a progredire verso una cura medica abilitata dall’intelligenza artificiale più accessibile per tutti.

MedPerf promuove fast.ai e altre librerie di apprendimento automatico ampiamente utilizzate per la loro usabilità, adattabilità e prestazioni al fine di facilitare una più ampia adozione. Microsoft Azure OpenAI Services, Epic Cognitive Computing e i punti di inferenza HF sono solo alcune delle API supportate solo da API e modelli di intelligenza artificiale privati.

MedPerf è stato originariamente progettato per la radiografia, ma è una piattaforma ad uso generale che può essere applicata a qualsiasi campo della biomedicina. MedPerf può supportare varie attività, tra cui patologia digitale e omica, grazie al suo progetto gemello, GaNDLF, dedicato a semplificare la costruzione di pipeline di apprendimento automatico. Per colmare il divario nell’ingegneria dei dati e dare ai programmatori accesso a modelli di visione artificiale e elaborazione del linguaggio naturale pre-addestrati di ultima generazione, MedPerf sta creando esempi per le librerie specializzate a basso codice in patologie computazionali, come PathML o SlideFlow, Spark NLP e MONAI.

Il team spera che il loro lavoro aumenti la fiducia nell’intelligenza artificiale medica, acceleri la diffusione dell’apprendimento automatico in contesti clinici e alla fine consenta all’intelligenza artificiale medica di adattare la cura a ciascun paziente, ridurre i costi sanitari e migliorare la qualità della vita sia per i medici che per i pazienti.