Ricercatori dell’UC San Diego introducono EUGENe un software genomics di deep learning facile da utilizzare

Ricercatori dell'UC San Diego presentano EUGENe, un software di deep learning genomics facile da usare

L’apprendimento profondo viene utilizzato in tutti i settori della vita. Ha la sua utilità in ogni campo. Ha un grande impatto sulla ricerca biomedica. È come un computer intelligente che può migliorare nelle attività con un pò di aiuto. Ha cambiato il modo in cui gli scienziati studiano la medicina e le malattie.

Ha un impatto importante nella genomica, un campo della biologia che investiga sull’organizzazione del DNA nei geni e sui processi attraverso i quali questi geni vengono attivati o disattivati all’interno delle singole cellule.

Ricercatori dell’Università della California, San Diego, hanno formulato una nuova piattaforma di apprendimento profondo che può essere rapidamente ed facilmente adattata per soddisfare vari progetti di genomica. Hannah Carter, Ph.D., professore associato nel Dipartimento di Medicina presso la Scuola di Medicina di UC San Diego, ha detto che ogni cellula ha lo stesso DNA, ma come il DNA viene espresso cambia l’aspetto e le funzioni delle cellule.

EUGENe utilizza moduli e sotto-pacchetti per facilitare funzioni essenziali all’interno di un flusso di lavoro di apprendimento profondo per la genomica. Queste funzioni includono (1) l’estrazione, la trasformazione e il caricamento dei dati di sequenza da diversi formati di file; (2) l’istanziazione, l’inizializzazione e l’addestramento di diverse architetture di modelli; e (3) la valutazione e l’interpretazione del comportamento del modello.

Anche se l’apprendimento profondo ha il potenziale per offrire preziose intuizioni sui diversi processi biologici che governano la variazione genetica, la sua implementazione rappresenta una sfida per i ricercatori che necessitano di maggiori competenze informatiche. I ricercatori hanno affermato che l’obiettivo era quello di sviluppare una piattaforma che consentisse ai ricercatori della genomica di semplificare l’analisi dei dati di apprendimento profondo, facilitando l’estrazione di previsioni dai dati grezzi con maggiore facilità ed efficienza.

Anche se solo circa il 2% del genoma totale consiste in geni che codificano proteine specifiche, il restante 98%, spesso chiamato DNA spazzatura a causa della presunta mancanza di funzione nota, svolge un ruolo cruciale nel determinare il momento, il luogo e il modo in cui certi geni vengono attivati. Comprendere i ruoli di queste sezioni non codificanti del genoma è stata una priorità per i ricercatori della genomica. L’apprendimento profondo si è rivelato uno strumento potente per raggiungere questo obiettivo, anche se utilizzarlo in modo efficace può essere difficile.

Adam Klie, uno studente di dottorato nel laboratorio di Carter e primo autore dello studio, ha detto che molte piattaforme esistenti richiedono molte ore di programmazione e manipolazione dei dati. Ha osservato che numerosi progetti richiedono ai ricercatori di iniziare il lavoro da zero, richiedendo competenze che potrebbero non essere facilmente disponibili a tutti i laboratori interessati in questo ambito.

Per valutarne l’efficacia, i ricercatori hanno testato EUGENe cercando di replicare i risultati di tre studi precedenti sulla genomica che utilizzavano una varietà di tipi di dati di sequenziamento. In passato, analizzare tali insiemi di dati diversi richiedeva l’integrazione di diverse piattaforme tecnologiche.

EUGENe ha dimostrato una notevole flessibilità, replicando efficacemente i risultati di ogni indagine. Questa flessibilità evidenzia la capacità della piattaforma di gestire una vasta gamma di dati di sequenziamento e il suo potenziale come strumento adattabile per la ricerca genomica.

EUGENe mostra adattabilità a diversi tipi di dati di sequenziamento del DNA e supporto per vari modelli di apprendimento profondo. I ricercatori mirano ad ampliare il suo campo di applicazione per includere una vasta gamma di tipi di dati, inclusi i dati di sequenziamento a singola cellula, e pianificano di rendere Eugene accessibile a gruppi di ricerca in tutto il mondo.

Carter ha espresso entusiasmo per il potenziale di collaborazione del progetto. Ha detto che una delle cose eccitanti di questo progetto è che più persone utilizzano la piattaforma, migliore diventa nel tempo, il che sarà essenziale dato che l’apprendimento profondo continua a evolversi rapidamente.