Incontra PepCNN uno strumento di apprendimento profondo per prevedere i residui di legame peptidico nelle proteine utilizzando sequenze, strutture e caratteristiche di modelli di linguaggio.

PepCNN Utilizzando sequenze, strutture e caratteristiche di modelli di linguaggio, un potente strumento di apprendimento profondo per prevedere i residui di legame peptidico nelle proteine.

PepCNN, un modello di apprendimento profondo sviluppato da ricercatori dell’Università di Griffith, RIKEN Center for Integrative Medical Sciences, Rutgers University e dell’Università di Tokyo, affronta il problema della previsione dei residui di legame proteina-peptide. PepCNN supera altri metodi in termini di specificità, precisione e metriche AUC combinando informazioni strutturali e basate sulla sequenza, rendendolo uno strumento prezioso per comprendere le interazioni proteina-peptide e promuovere il progresso nella scoperta di farmaci.

La comprensione delle interazioni proteina-peptide è fondamentale per i processi cellulari e i meccanismi delle malattie come il cancro, rendendo necessari metodi computazionali poiché gli approcci sperimentali sono onerosi in termini di risorse. I modelli computazionali, suddivisi in quelli basati sulla struttura e quelli basati sulla sequenza, offrono alternative. Utilizzando le caratteristiche dei modelli di linguaggio proteico pre-addestrati e i dati di esposizione, PepCNN supera i metodi precedenti, evidenziando l’importanza del suo set di caratteristiche per migliorare l’accuratezza delle previsioni nelle interazioni proteina-peptide.

C’è bisogno di approcci computazionali per approfondire la comprensione delle interazioni proteina-peptide e il loro ruolo nei processi cellulari e meccanismi delle malattie. Sebbene siano stati sviluppati modelli basati sulla struttura e sulla sequenza, l’accuratezza rimane una sfida a causa della complessità delle interazioni. PepCNN, un nuovo modello di apprendimento profondo, è stato proposto per affrontare questa sfida integrando informazioni strutturali e basate sulla sequenza per prevedere i residui di legame dei peptidi. Con prestazioni superiori rispetto ai metodi esistenti, PepCNN è uno strumento promettente per supportare gli sforzi nella scoperta di farmaci e nell’avanzamento della comprensione delle interazioni proteina-peptide.

PepCNN utilizza tecniche innovative come l’esposizione a semi-sfera, le matrici di punteggio posizionale specifico e l’incorporazione di un modello di linguaggio proteico pre-addestrato per ottenere risultati superiori rispetto a nove metodi esistenti, inclusa PepBCL. La sua specificità e precisione impressionanti si distinguono e le sue prestazioni superano altri metodi all’avanguardia. Questi progressi mettono in evidenza l’efficacia del metodo proposto.

Il modello di previsione dell’apprendimento profondo, PepCNN, ha superato vari metodi, inclusa PepBCL, con una maggiore specificità, precisione e AUC. Dopo essere stato valutato su due set di test, PepCNN ha mostrato notevoli miglioramenti, in particolare nell’AUC. I risultati hanno mostrato una sensibilità del 0,254, una specificità del 0,988, una precisione del 0,55, una MCC del 0,350 e un AUC del 0,843 nel primo set di test. La ricerca futura mira a integrare la tecnologia DeepInsight per facilitare l’applicazione di architetture CNN 2D e tecniche di apprendimento trasferito per ulteriori sviluppi.

In conclusione, il modello di previsione avanzato basato sull’apprendimento profondo, PepCNN, che incorpora informazioni strutturali e basate sulla sequenza da sequenze proteiche primarie, supera i metodi esistenti in termini di specificità, precisione e AUC, come dimostrato dai test condotti su set di dati TE125 e TE639. La ricerca futura mira a migliorarne le prestazioni integrando la tecnologia DeepInsight, consentendo l’applicazione di architetture CNN 2D e tecniche di apprendimento trasferito.