AlphaFold lascia il segno nella previsione delle strutture proteiche

AlphaFold lascia il segno nella previsione delle strutture proteiche
Credito: DeepMind

I giocatori applaudono, pronunciano parole come Whoo, sbattono coltelli di plastica sul tavolo e si godono i migliori weekend con l’intelligenza artificiale come atto principale, grazie all’IA scatenata nei giochi.

CABLATO REGNO UNITOIl redattore scientifico di Matt Reynolds ha esaminato l’impatto di DeepMind sulle pietre miliari dell’IA: “Ha superato i campioni di Go, ha battuto i giocatori professionisti di StarCraft e ha rivolto la sua attenzione agli scacchi e allo shogi”.

Lascia che i giochi continuino, ma le cose serie devono brillare seriamente. In breve, possiamo ammirare che scatenare l’IA ai fini della scoperta scientifica è diventato particolarmente vivo e vegeto grazie alla ricerca di DeepMind.

Questa settimana gli osservatori tecnologici hanno commentato i documenti di ricerca che mostrano i punti di forza dell’IA. “Man mano che l’IA matura come campo (e esaurisce i videogiochi da conquistare), probabilmente più dei suoi risultati saranno simili a questi: solidi miglioramenti in importanti domini di ricerca”.

Un documento di ricerca pubblicato in Natura ha fatto notizia immediata come documento su come l’IA può essere utilizzata per prevedere il ripiegamento delle proteine. VentureBeat riferito a sfide formidabili sempre più vicine agli obiettivi.

L’articolo è “Previsione della struttura proteica migliorata utilizzando i potenziali dell’apprendimento profondo”, L’articolo è stato pubblicato online il 15 dicembre in Natura.

Il sistema DeepMind si chiama AlphaFold. Reynolds ha fatto una nota interessante su AlphaFold e il set di dati: “Il campo di ripiegamento delle proteine ​​è anche ben impostato per addestrare agenti artificialmente intelligenti. Ha un ampio set di dati: la Protein Data Bank, un repository della struttura 3-D e del corredo genetico di 150.000 proteine, che sono state utilizzate per addestrare il sistema di previsione della struttura delle proteine ​​di DeepMind, chiamato AlphaFold”.

Il documento ha esplorato i risultati ottenuti finora da DeepMind nell’utilizzo dell’IA per prevedere il ripiegamento delle proteine. Il grosso problema del ripiegamento delle proteine ​​è che, come dice Kelsey Piper Vox ha osservato, è una “questione cruciale per lo sviluppo di nuovi farmaci”.

Tre membri del team di DeepMind, Andrew Senior, John Jumper e Demis Hassabis, hanno pubblicato un post sul blog del 15 gennaio spiegando le strutture delle proteine, la sfida del ripiegamento delle proteine ​​e ciò che volevano ottenere.

“Come dimostrato dal paradosso di Levinthal, ci vorrebbe più tempo dell’età dell’universo conosciuto per enumerare casualmente tutte le possibili configurazioni di una tipica proteina prima di raggiungere la vera struttura 3-D e le proteine ​​stesse si ripiegano spontaneamente, in pochi millisecondi. Prevedere come queste catene si ripiegherà nell’intricata struttura 3-D di una proteina è ciò che è noto come il “problema del ripiegamento delle proteine” 揳 sfida su cui gli scienziati hanno lavorato per decenni”.

Il team ha dimostrato di poter addestrare una rete neurale per fare previsioni accurate “delle distanze tra coppie di residui, che trasmettono più informazioni sulla struttura rispetto alle previsioni di contatto”.

Hanno parlato di ottimizzazione tramite “un semplice algoritmo di discesa del gradiente per generare strutture senza complesse procedure di campionamento”.

Il grosso problema dell’audacia proteica è che, ha detto Piper, è una “questione cruciale per lo sviluppo di nuovi farmaci”. Come mai? E perché le “forme” sono così importanti? “La forma che assumono le proteine ​​​​predice con quali altre sostanze interagiranno, quindi la comprensione del ripiegamento delle proteine ​​è fondamentale per la scoperta di farmaci e potrebbe persino essere utilizzata per lo sviluppo di nuovi processi di produzione”, ha affermato Piper.

AlphaFold lascia il segno nella previsione delle strutture proteiche
Due modi per visualizzare l’accuratezza delle previsioni di alphafold. la figura in alto mostra le matrici di distanza per tre proteine. La luminosità di ciascun pixel rappresenta la distanza tra gli amminoacidi nella sequenza che comprende la proteina: più luminoso è il pixel, più vicina è la coppia. Nella riga superiore sono mostrate le distanze reali, determinate sperimentalmente e, nella riga inferiore, la media delle distribuzioni di distanza previste da AlphaFold. È importante sottolineare che questi corrispondono bene sia su scala globale che locale. i pannelli inferiori rappresentano lo stesso confronto utilizzando modelli 3D, con previsioni AlphaFold檚 (blu) rispetto a dati di verità fondamentale (verde) per le stesse tre proteine. Credito: DeepMind

Il blog DeepMind ha affermato che “si ritiene che la forma di una proteina ne determini la funzione. Una volta compresa la forma di una proteina, è possibile indovinarne il ruolo all’interno della cellula e gli scienziati possono sviluppare farmaci che funzionano con la forma unica della proteina”.

AlphaFold potrebbe aiutare i ricercatori a comprendere meglio la funzione e il malfunzionamento delle proteine.

Una citazione degna di nota in VentureBeat dal capo del gruppo di bioinformatica dell’UCL David Jones, che ha consigliato il team di DeepMind su parti del progetto:

“Le tecniche sperimentali per determinare le strutture delle proteine ​​sono lunghe e costose, quindi c’è un’enorme richiesta di algoritmi informatici migliori per calcolare le strutture delle proteine ​​direttamente dalle sequenze geniche che le codificano, e il lavoro di DeepMind sull’applicazione dell’IA a questo problema di vecchia data nella biologia molecolare è un netto progresso”.

Quali tipi di tecniche sperimentali hanno richiesto tempo e denaro? Il blog ha menzionato la microscopia crioelettronica, la risonanza magnetica nucleare e la cristallografia a raggi X, ciascuna a seconda di tentativi ed errori, “che possono richiedere anni di lavoro e costare decine o centinaia di migliaia di dollari per struttura proteica”.

Kyle Wiggers dentro VentureBeat: “Con AlphaFold, il team di ricerca di DeepMind si è concentrato sul problema della modellazione di forme target da zero senza attingere a proteine ​​​​risolte come modelli”.

Come la natura definisce il ripiegamento proteico: “Il ripiegamento proteico è il processo mediante il quale le proteine ​​raggiungono la loro struttura terziaria funzionale (nativa) matura e spesso inizia in modo co-traslazionale. Il ripiegamento proteico richiede accompagnatori e spesso implica la creazione graduale di strutture secondarie e supersecondarie regolari, vale a dire 伪-eliche e 尾-fogli, che si piegano rapidamente, stabilizzati da legami idrogeno e ponti disolfuro, e quindi struttura terziaria.”

A luglio, prima della pubblicazione del documento DeepMind, Natura aveva già preso atto che “la corsa per risolvere una delle più grandi sfide della biologia – correggere le strutture 3-D delle proteine ​​dalle loro sequenze di amminoacidi – si sta intensificando, grazie ai nuovi approcci di intelligenza artificiale (AI)”.

Il post del blog di DeepMind affermava di aver reso disponibile il codice (GitHub) e offerto il collegamento a chiunque volesse saperne di più o replicare i propri risultati.

Nel loro post sul blog hanno affermato perché il loro sistema è importante: “Il nostro sistema, AlphaFold… si basa su decenni di ricerche precedenti utilizzando grandi set di dati genomici per prevedere la struttura delle proteine. I modelli 3-D delle proteine ​​che genera AlphaFold sono molto più accurati di qualsiasi altro che sono venuti prima”.

Andando avanti, il blog ha affermato che uno strumento come AlphaFold potrebbe aiutare i ricercatori di malattie rare a prevedere la forma di una proteina di interesse in modo rapido ed economico e potrebbe infine aiutarli a contribuire alla scoperta di farmaci efficienti, riducendo i costi associati alla sperimentazione.

La ricerca sulle malattie rare non è l’unica area che può trarre vantaggio da ciò che hanno realizzato. Il blog parlava di inquinanti come plastica e petrolio; i progressi negli enzimi biodegradabili resi possibili dalla progettazione delle proteine ​​potrebbero aiutare ad abbattere i rifiuti in modi più rispettosi del nostro ambiente.

“In effetti, i ricercatori hanno già iniziato a progettare batteri per secernere proteine ​​che renderanno i rifiuti biodegradabili e più facili da elaborare”, secondo il blog.


Leave a Reply