Mettere il potere di AlphaFold nelle mani del mondo

'Dare il potere di AlphaFold al mondo'

A luglio 2022, abbiamo rilasciato le previsioni sulla struttura delle proteine AlphaFold per quasi tutte le proteine catalogate conosciute dalla scienza. Leggi l’ultimo articolo sul blog qui.

Oggi, sono incredibilmente orgoglioso ed emozionato di annunciare che DeepMind sta apportando un significativo contributo alla comprensione della biologia umana.

Quando abbiamo annunciato AlphaFold 2 lo scorso dicembre, è stato accolto come una soluzione al problema del piegamento delle proteine, un enigma che durava da 50 anni. La scorsa settimana, abbiamo pubblicato l’articolo scientifico e il codice sorgente che spiegano come abbiamo creato questo sistema altamente innovativo, e oggi condividiamo previsioni di alta qualità sulla forma di ogni singola proteina presente nel corpo umano, così come per le proteine di altre 20 specie su cui gli scienziati si basano per le loro ricerche.

Mentre i ricercatori cercano cure per le malattie e perseguono soluzioni ad altri grandi problemi che affliggono l’umanità, come la resistenza agli antibiotici, l’inquinamento da microplastica e il cambiamento climatico, trarranno vantaggio da nuove intuizioni sulla struttura delle proteine. Le proteine sono come piccole e squisite macchine biologiche. Allo stesso modo in cui la struttura di una macchina ci dice cosa fa, così la struttura di una proteina ci aiuta a capirne la funzione. Oggi condividiamo un tesoro di informazioni che raddoppia la comprensione dell’ome proteico umano e rivela le strutture proteiche presenti in altre 20 specie biologicamente significative, dall’E.coli al lievito, dalla mosca della frutta al topo.

Questo sarà uno dei dataset più importanti dopo la mappatura del genoma umano. Ewan Birney, Vice Direttore Generale di EMBL e Direttore di EMBL-EBI

Come potente strumento che supporta gli sforzi dei ricercatori, riteniamo che questa sia la più significativa contribuzione dell’IA all’avanzamento della conoscenza scientifica fino ad oggi, ed è un ottimo esempio dei benefici che l’IA può portare all’umanità. Queste intuizioni saranno alla base di molti futuri progressi entusiasmanti nella comprensione della biologia e della medicina. Grazie a cinque anni di lavoro instancabile e a molta ingegnosità da parte del team di AlphaFold, e grazie alla stretta collaborazione degli ultimi mesi con i nostri partner presso l’Istituto Bioinformatico Europeo (EMBL-EBI) dell’EMBL, siamo in grado di condividere questa enorme e preziosa risorsa con il mondo.

Prossimo articolo:

Questo ultimo lavoro si basa sugli annunci che abbiamo fatto lo scorso dicembre, alla conferenza CASP14, quando DeepMind ha presentato una nuova versione radicale del nostro sistema AlphaFold, che è stato riconosciuto dagli organizzatori dell’evento come una soluzione al vecchio grande problema di comprendere la struttura tridimensionale delle proteine. Determinare sperimentalmente le strutture proteiche richiede tempo e impegno, ma AlphaFold ha dimostrato che l’IA può prevedere con precisione la forma di una proteina, su larga scala e in pochi minuti, con accuratezza atomica. Al CASP, ci siamo impegnati a condividere i nostri metodi e offrire un ampio accesso a questo corpus di conoscenze.

Miglioramenti nella precisione mediana delle previsioni nella categoria di modellazione libera per il miglior team di ciascun CASP, misurato come miglior punteggio di 5 GDT.

Questo mese, abbiamo completato un enorme lavoro per mantenere quel impegno. Abbiamo pubblicato due articoli sottoposti a revisione paritaria su Nature (1, 2) e abbiamo reso open source il codice di AlphaFold. Oggi, in collaborazione con EMBL-EBI, siamo incredibilmente orgogliosi di lanciare il Database delle Strutture Proteiche di AlphaFold, che offre l’immagine più completa e accurata dell’ome proteico umano fino ad oggi, raddoppiando la conoscenza accumulata dell’umanità sulle strutture proteiche umane ad alta precisione.

Oltre all’ome proteico umano (tutte le ~20.000 proteine espresse dal genoma umano), offriamo l’accesso aperto ai proteomi di altre 20 specie biologicamente significative, per un totale di oltre 350.000 strutture proteiche. La ricerca su queste specie è stata oggetto di innumerevoli articoli di ricerca e numerosi importanti progressi, e ha portato a una comprensione più profonda della vita stessa. Nei prossimi mesi, abbiamo in programma di espandere notevolmente la copertura a quasi tutte le proteine sequenziate note alla scienza, con oltre 100 milioni di strutture che coprono la maggior parte del database di riferimento UniProt. È un vero e proprio almanacco proteico del mondo. E il sistema e il database saranno aggiornati periodicamente mentre continuiamo a investire in futuri miglioramenti di AlphaFold.

Cosa ancora più entusiasmante, nelle mani dei ricercatori di tutto il mondo, questo nuovo almanacco proteico consentirà e accelererà la ricerca che avanzerà la nostra comprensione di questi mattoni fondamentali della vita. Già attraverso le nostre prime collaborazioni, abbiamo visto segnali promettenti da parte dei ricercatori che utilizzano AlphaFold nel loro lavoro. Ad esempio, l’Iniziativa per i Medicinali per le Malattie Neglette (DNDi) ha avanzato la propria ricerca su cure salvavita per malattie che colpiscono in modo sproporzionato le parti più povere del mondo, e il Centro per l’Innovazione degli Enzimi presso l’Università di Portsmouth (CEI) sta utilizzando AlphaFold per aiutare a progettare enzimi più veloci per il riciclo di alcuni dei nostri plastici monouso più inquinanti. Per quei ricercatori che si affidano alla determinazione sperimentale della struttura delle proteine, le previsioni di AlphaFold hanno contribuito ad accelerare la loro ricerca. Come altro esempio, un team presso l’Università di Colorado Boulder sta trovando promesse nell’utilizzo delle previsioni di AlphaFold per lo studio della resistenza agli antibiotici, mentre un gruppo presso l’Università della California San Francisco le ha utilizzate per aumentare la loro comprensione della biologia del SARS-CoV-2. E questo è solo l’inizio di quello che speriamo sia una rivoluzione nella bioinformatica strutturale. Con AlphaFold nel mondo, c’è un tesoro di dati che aspetta di essere trasformato in futuri progressi.

AlphaFold apre nuovi orizzonti di ricerca ed è stimolante vedere un potente AI all’avanguardia che permette di lavorare su malattie che sono concentrate quasi esclusivamente nelle popolazioni impoverite. – Ben Perry, Discovery Open Innovation Leader, Drugs for Neglected Diseases Initiative (DNDi)

Per il team di AlphaFold di DeepMind, questo lavoro rappresenta il culmine di cinque anni di enormi sforzi, compresa la necessità di superare creativamente molti ostacoli sfidanti, risultando in una serie di nuove sofisticate innovazioni algoritmiche che erano tutte necessarie per risolvere finalmente il problema. Si basa sulle scoperte di generazioni di scienziati, dai pionieri precoci dell’immagine e cristallografia delle proteine, ai migliaia di specialisti nella previsione e biologi strutturali che hanno passato anni sperimentando con le proteine. Il nostro sogno è che AlphaFold, fornendo questa comprensione fondamentale, aiuti innumerevoli altri scienziati nel loro lavoro e apra completamente nuove vie di scoperta scientifica.

Ciò che ci è voluto mesi e anni per fare, AlphaFold è stato in grado di farlo in un fine settimana. ‍ – Professor John McGeehan, Professor of Structural Biology and Director for the Centre, Centre for Enzyme Innovation (CEI) at the University of Portsmouth

Da DeepMind, la nostra tesi è sempre stata che l’intelligenza artificiale possa accelerare in modo significativo le scoperte in molti campi della scienza e, di conseguenza, far progredire l’umanità. Abbiamo costruito AlphaFold e il database delle strutture proteiche di AlphaFold per supportare ed elevare gli sforzi degli scienziati di tutto il mondo nel loro importante lavoro. Crediamo che l’IA abbia il potenziale per rivoluzionare il modo in cui si fa scienza nel XXI secolo e attendiamo con impazienza le scoperte che AlphaFold potrebbe aiutare la comunità scientifica a sbloccare in seguito.

Per saperne di più, vai su Nature per leggere i nostri articoli sottoposti a revisione paritaria che descrivono il nostro metodo completo e il proteoma umano. Puoi leggere ulteriori informazioni su di essi nel nostro blog tecnico. Se vuoi esplorare il nostro sistema, ecco il codice open-source di AlphaFold e il notebook Colab per eseguire sequenze individuali. Per esplorare le nostre strutture, EMBL-EBI, leader mondiale nei dati biologici, le ospita in un database consultabile che è aperto e gratuito per tutti.

Ci piacerebbe sentire i tuoi feedback e capire come AlphaFold sia stato utile nella tua ricerca. Condividi le tue storie all’indirizzo [email protected].