Due nuovi articoli analizzano in dettaglio l’universo delle proteine svelato dai 200 milioni di modelli di AlphaFold 2

Due nuovi articoli analizzano i dettagli dell'universo delle proteine rivelato da 200 milioni di modelli di AlphaFold 2.

E hanno dovuto creare nuovi strumenti per gestire un così grande volume di modelli strutturali proteici

Una delle risorse presentate negli articoli discussi, https://uniprot3d.org/, rappresenta proteine diffuse come in una visione moderna dell'universo in cui i cluster più luminosi contengono più membri. Ingrandendo, l'utente può ispezionare proteine correlate, fino a quando facendo clic su un nodo specifico viene visualizzata un'informazione (qui viene mostrato solo un modello strutturale) su una famiglia di proteine nel contesto di Uniprot. Immagine composta dall'autore durante la navigazione del sito web.

Il recente rilascio di oltre 200 milioni di strutture proteiche previste da parte di AlphaFold 2 di DeepMind, in collaborazione con l’Istituto Europeo di Bioinformatica, ha inaugurato una nuova era della ricerca sulle proteine. Qui presento un riassunto delle scoperte di due studi rivoluzionari pubblicati su Nature questa settimana, che approfondiscono le profondità di questo universo proteico. Questi studi utilizzano algoritmi di raggruppamento innovativi, confronti strutturali e altre varianti di strumenti esistenti per lavorare su volumi di dati ampi, al fine di far luce sulla diversità strutturale, le relazioni evolutive e il potenziale funzionale delle proteine su una scala senza precedenti.

Le proteine sono i cavalli di battaglia della biologia, governando una miriade di processi cellulari, dalla generazione di energia alla divisione cellulare. Mentre il sequenziamento delle proteine è aumentato negli anni, grazie ai progressi nella genomica, la determinazione delle loro strutture tridimensionali è rimasta indietro a causa della scarsità di metodi sperimentali scalabili. Tuttavia, con l’avvento di AlphaFold 2, un rivoluzionario sistema di intelligenza artificiale sviluppato da DeepMind, il panorama della predizione della struttura proteica è stato trasformato. Il Database delle Strutture Proteiche di AlphaFold (AFDB) ospita ora ben 200 milioni di strutture proteiche previste, segnando una pietra miliare nella biologia computazionale.

Database basati su AlphaFold e interfacce AlphaFold online completamente funzionali e facili da usare in posizione…

Non solo biologia computazionale ma anche biologia sperimentale. Riflessioni sul futuro delle nicchie di scienza dei dati in biologia.

towardsdatascience.com

Ora, proprio questa settimana, due gruppi di autori scrivono su Nature per riportare come utilizzare i modelli proteici di AlphaFold 2 per scoprire nuove intuizioni sull’universo delle proteine. Questi studi sfruttano versioni innovative di strumenti esistenti adattati all’enorme volume di dati nell’AFDB; ad esempio, versioni moderne di algoritmi di raggruppamento e metodi per confronti strutturali. Con questi strumenti adattati, i lavori esplorano l’ampio spettro delle strutture proteiche, le loro origini evolutive e le loro implicazioni funzionali.