I ricercatori presso l’Università di Michigan State hanno sviluppato ‘DANCE’, una libreria Python per supportare modelli di apprendimento profondo per l’analisi dell’espressione genica a livello di singola cellula su larga scala.
I ricercatori dell'Università di Michigan State hanno creato 'DANCE', una libreria Python per l'analisi dell'espressione genica a livello di singola cellula.
Dal profilo di singola modalità (RNA, proteina e cromatina aperta) al profilo multimodale e alla trascrittomica spaziale, la tecnologia per l’analisi delle singole cellule è avanzata rapidamente negli ultimi anni. Una proliferazione di approcci computazionali, soprattutto quelli basati sull’apprendimento automatico, è stata quindi favorita dalla rapida espansione di questo argomento.
I ricercatori affermano che sia difficile replicare i risultati come mostrato negli articoli originali a causa della diversità e complessità degli approcci attuali. La regolazione degli iperparametri, le incompatibilità tra linguaggi di programmazione e la mancanza di una base di codice disponibile pubblicamente rappresentano ostacoli significativi. Poiché la maggior parte dei lavori esistenti ha riportato solo le prestazioni su set di dati limitati e confronti con metodologie insufficienti, è necessaria una procedura di benchmarking sistematica per valutare i metodi in modo completo.
Come parte di uno studio recente, i ricercatori della Michigan State University, dell’University of Washington, dello Zhejiang University of Technology, della Stanford University e della Johnson & Johnson introducono DANCE, una libreria e un benchmark di deep learning progettati per accelerare gli sviluppi nell’analisi delle singole cellule.
- Top Strumenti per la Semplificazione e Standardizzazione del Machine Learning
- 16 Strumenti di Intelligenza Artificiale per Accelerare il Tuo Lavoro
- Ricercatori dalla Cina hanno proposto un nuovo metodo di screening delle immagini μXRD basato sull’apprendimento federato (FL) per migliorare lo screening proteggendo al contempo la privacy dei dati.
DANCE offre un set completo di strumenti per l’analisi dei dati delle singole cellule su larga scala, consentendo agli sviluppatori di creare i propri modelli di deep learning con maggiore facilità ed efficienza. Inoltre, può essere utilizzato come benchmark per confrontare le prestazioni di vari modelli computazionali per l’analisi delle singole cellule. Attualmente, DANCE include il supporto per 3 moduli, 8 compiti, 32 modelli e 21 set di dati.
Attualmente, DANCE offre:
- Analisi di singola modalità.
- Analisi multimodale
- Analisi della trascrittomica spaziale
Gli autoencoder e le GNN sono framework di deep learning ampiamente utilizzati supportati e applicabili in generale. Secondo il loro articolo, DANCE è la prima piattaforma di benchmark completa per l’analisi delle singole cellule.
In questo lavoro, i ricercatori hanno utilizzato componenti innovativi. Hanno iniziato il lavoro compilando set di dati di benchmark standard specifici per il compito e rendendoli prontamente disponibili con un singolo parametro di regolazione. Vengono implementati algoritmi di base di apprendimento classico e profondo per ogni compito. Tutti i set di dati di benchmark raccolti vengono utilizzati per ottimizzare i modelli di base fino a ottenere gli stessi o migliori risultati degli studi originali. Gli utenti finali devono solo eseguire un singolo comando in cui hanno racchiuso tutti i super-parametri in anticipo per ottenere le prestazioni dichiarate dei modelli ottimizzati.
Il team ha utilizzato il framework PyTorch Geometric (PSG) come base. Inoltre, standardizzano le loro basi trasformandole in un framework di addestramento-previsione-punteggio. Per ogni compito, tutti gli algoritmi implementati vengono ottimizzati su tutti i benchmark standard raccolti tramite ricerca a griglia per ottenere il modello ottimale. I super-parametri correlati vengono memorizzati in un singolo comando per la riproducibilità dell’utente.
Il team ritiene che il loro lavoro apporti benefici all’intera comunità delle singole cellule dalla piattaforma DANCE. Gli utenti finali non devono dedicare molto tempo ed sforzi all’implementazione e all’ottimizzazione del modello. Invece, tutto ciò che devono fare per replicare i nostri risultati è eseguire il comando. Inoltre, i ricercatori forniscono anche il supporto per le unità di elaborazione grafica (GPU) per l’addestramento rapido dei modelli basati sull’apprendimento profondo.
Attualmente, DANCE non dispone di un set unificato di strumenti per la pre-elaborazione e la creazione di grafici. Il team ha in programma di lavorare su questo in futuro. Hanno anche dichiarato che DANCE sarà reso disponibile come servizio SaaS in modo che gli utenti non debbano fare affidamento esclusivamente sulla potenza di elaborazione e la capacità di archiviazione del proprio dispositivo.
Questo articolo è scritto come un riassunto di ricerca di Marktechpost Staff basato sull'articolo di ricerca 'DANCE: A Deep Learning Library and Benchmark for Single-Cell Analysis'. Tutti i crediti per questa ricerca vanno ai ricercatori di questo progetto. Consulta l'articolo, il codice e lo strumento.
Per favore, non dimenticare di unirti al nostro subreddit di ML
L’articolo I ricercatori della Michigan State University hanno sviluppato ‘DANCE’, una libreria Python per supportare modelli di deep learning per l’analisi dell’espressione genica delle singole cellule su larga scala è apparso per la prima volta su MarkTechPost.