自發(fā)布以來,AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面取得了相當大的成功,引發(fā)了廣泛關(guān)注。然而,關(guān)于AlphaFold等蛋白質(zhì)結(jié)構(gòu)預(yù)測工具對于藥物發(fā)現(xiàn)的實際意義存在廣泛爭論。如何利用AlphaFold為藥物發(fā)現(xiàn)提供更多幫助,AlphaFold在哪些藥物發(fā)現(xiàn)問題上表現(xiàn)得更好,在哪些方面還有待提高?
蛋白質(zhì)結(jié)構(gòu)在水溶液中可以呈現(xiàn)多種構(gòu)象,并且在與其他分子相互作用時發(fā)生結(jié)構(gòu)變化。捕捉和理解這些動態(tài)變化對于揭示蛋白質(zhì)的功能至關(guān)重要,然而技術(shù)水平的不足會從很大程度上限制蛋白質(zhì)結(jié)構(gòu)解析的準確率。
蛋白質(zhì)結(jié)構(gòu)測定是生物學(xué)和生物醫(yī)藥研究中的一個重要領(lǐng)域。雖然X射線晶體學(xué)、核磁共振(NMR)和冷凍電鏡(Cryo-EM)等技術(shù)對很多蛋白質(zhì)來說,已經(jīng)能夠提供相對高分辨率的結(jié)構(gòu)圖像,但蛋白質(zhì)結(jié)構(gòu)在水溶液中不是靜態(tài)的,它們可以呈現(xiàn)多種構(gòu)象,并且在與其他分子相互作用時發(fā)生結(jié)構(gòu)變化。捕捉和理解這些動態(tài)變化對于揭示蛋白質(zhì)的功能至關(guān)重要,然而技術(shù)水平的不足會在很大程度上限制結(jié)構(gòu)解析的準確率。即使是剛性度比較大的蛋白質(zhì),想要獲取其高精度的結(jié)構(gòu)圖像,現(xiàn)有的實驗手段也存在較大誤差。某些蛋白質(zhì),特別是那些難以形成穩(wěn)定晶體、尺寸過大或過小以及不能形成穩(wěn)定結(jié)構(gòu)的蛋白質(zhì)等,仍然難以獲取高質(zhì)量的結(jié)構(gòu)。
人工智能和機器學(xué)習(xí)技術(shù)的引入,為提高蛋白質(zhì)結(jié)構(gòu)預(yù)測的速度和準確性提供了助力,開啟了結(jié)構(gòu)生物學(xué)研究的新篇章。AlphaFold等AI方法在很多方面彌補了傳統(tǒng)實驗方法在測定蛋白質(zhì)結(jié)構(gòu)中的不足,可以在短時間內(nèi)預(yù)測蛋白質(zhì)的結(jié)構(gòu),大大降低了時間和經(jīng)濟成本。對于一些難以通過傳統(tǒng)方法獲得結(jié)構(gòu)的蛋白質(zhì),例如難以形成穩(wěn)定晶體的蛋白質(zhì)或某些大型膜蛋白,使用AI方法預(yù)測蛋白質(zhì)結(jié)構(gòu)能夠不依賴于蛋白質(zhì)的物理樣品,從而繞過傳統(tǒng)方法的一些限制。
隨著技術(shù)的發(fā)展,尤其是深度學(xué)習(xí)在蛋白質(zhì)結(jié)構(gòu)預(yù)測中的應(yīng)用,AI方法在精度上取得了顯著的進步。例如,AlphaFold2在2020年的Critical Assessment of Structure Prediction(CASP) 競賽中展示了前所未有的高精度預(yù)測能力。AI方法可以作為傳統(tǒng)實驗方法的輔助工具,通過預(yù)測結(jié)果指導(dǎo)實驗設(shè)計。
盡管AI方法在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面取得了顯著成果,但也存在著局限性。比如,對于序列同源性較高的蛋白,側(cè)鏈建模精度依然存在較大誤差;對序列同源性低的蛋白,總體預(yù)測精度依然不高。
需要特別強調(diào)的是,蛋白質(zhì)側(cè)鏈建模精度是蛋白質(zhì)結(jié)構(gòu)預(yù)測研究領(lǐng)域的核心,所有蛋白質(zhì)結(jié)構(gòu)建模問題的精確度,如蛋白質(zhì)折疊、蛋白質(zhì)-蛋白質(zhì)相互作用、蛋白質(zhì)-配體相互作用、氨基酸突變、蛋白質(zhì)進化等,都與側(cè)鏈建模的準確性有關(guān)。此外,對于極端復(fù)雜的蛋白質(zhì)、動態(tài)結(jié)構(gòu)或是蛋白質(zhì)復(fù)合體的預(yù)測等,AlphaFold2也存在局限性。
值得注意的是,在面向生物制藥等實際應(yīng)用領(lǐng)域,AlphaFold2等預(yù)測手段和傳統(tǒng)實驗方法往往是互補的,預(yù)測手段并不能取代實驗結(jié)果。因為藥物設(shè)計是一項十分精細的技術(shù),很小的結(jié)構(gòu)誤差可能會導(dǎo)致巨大的偏差,預(yù)測手段和傳統(tǒng)實驗方法結(jié)合才可以更全面地解決蛋白質(zhì)結(jié)構(gòu)測定的問題。
使用AlphaFold預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),可以幫助研究者理解未知或未被充分研究蛋白質(zhì)的功能,發(fā)現(xiàn)新的藥物作用靶點或驗證現(xiàn)有的靶點。在使用時,研究者應(yīng)注意將預(yù)測模型與實驗結(jié)果相結(jié)合,以驗證和優(yōu)化預(yù)測結(jié)果。
AlphaFold通過預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),可以幫助研究者理解未知或未被充分研究蛋白質(zhì)的功能,發(fā)現(xiàn)新的藥物作用靶點或驗證現(xiàn)有的靶點。
雖然AlphaFold已經(jīng)可以較為精確地預(yù)測高同源性靶點蛋白的三級結(jié)構(gòu),但是無法考慮到靶點蛋白的周圍環(huán)境信息,如結(jié)合配體等,而這些信息對藥物設(shè)計極其重要。此外,靶點蛋白與藥物的結(jié)合是一個動態(tài)過程,蛋白質(zhì)的結(jié)構(gòu)會隨著該過程的進行而發(fā)生一定變化,而對該變化的模擬也是AlphaFold所欠缺的。
在使用AlphaFold等AI工具預(yù)測的蛋白質(zhì)結(jié)構(gòu)進行基于結(jié)構(gòu)的藥物設(shè)計時,研究者應(yīng)當注意驗證和參考實驗數(shù)據(jù)。對于重要靶點,應(yīng)優(yōu)先考慮已有實驗結(jié)構(gòu)或使用實驗方法進一步驗證關(guān)鍵部分的結(jié)構(gòu)。蛋白質(zhì)不是靜態(tài)的,它們可以在多種穩(wěn)定或亞穩(wěn)定的構(gòu)象之間轉(zhuǎn)換,理解和考慮這種動態(tài)性對于識別藥物分子的結(jié)合位點、改善藥物分子的親和力和選擇性等都至關(guān)重要。在缺乏實驗驗證的情況下,應(yīng)謹慎對待預(yù)測結(jié)構(gòu)的細節(jié),避免過度解釋可能的誤差或不確定性。
此外,在設(shè)計藥物時應(yīng)避免過度優(yōu)化對預(yù)測模型特定細節(jié)的配合,以免造成“過擬合”。可以結(jié)合使用多種預(yù)測工具和實驗技術(shù),例如將AlphaFold預(yù)測的結(jié)構(gòu)與實驗數(shù)據(jù)、其他預(yù)測模型的結(jié)果等結(jié)合,以獲得更準確的蛋白質(zhì)三維結(jié)構(gòu)。
最終,所有基于預(yù)測結(jié)構(gòu)的設(shè)計都需要通過生物學(xué)實驗進行驗證,包括靶標的結(jié)合親和力測試、細胞活性測試、動物模型研究等,以確保預(yù)測結(jié)構(gòu)的實用性和藥物分子的有效性。
活性位點是藥物研發(fā)人員非常關(guān)注的區(qū)域,通常是蛋白質(zhì)上的特定小區(qū)域,負責(zé)與底物、抑制劑或其他蛋白質(zhì)相互作用。AlphaFold的預(yù)測可以精確地描繪出蛋白質(zhì)的整體構(gòu)型,包括可能的活性位點區(qū)域。如果整體結(jié)構(gòu)預(yù)測是準確的,那么活性位點區(qū)域的結(jié)構(gòu)也有望被準確預(yù)測。然而,對于某些蛋白質(zhì),特別是那些靈活的或未充分特征化的蛋白質(zhì),預(yù)測的準確性可能會下降,并且確定一個區(qū)域是否為活性位點通常需要更多的功能性和生物化學(xué)數(shù)據(jù)。
在實際應(yīng)用中,藥物研發(fā)人員可以結(jié)合使用AlphaFold和其他方法來識別和驗證活性位點,比如突變分析、結(jié)合實驗,以及分子對接、動態(tài)模擬等其他計算方法。除了結(jié)構(gòu)預(yù)測之外,通常還需要對蛋白質(zhì)進行功能注釋,確定可能的活性位點、配體結(jié)合區(qū)和蛋白質(zhì)相互作用界面。
在藥物發(fā)現(xiàn)中,使用AlphaFold模型預(yù)測藥物/配體結(jié)合模式的準確性是研發(fā)人員非常關(guān)注的問題。使用AlphaFold模型或類似的AI結(jié)構(gòu)預(yù)測工具來預(yù)測藥物或配體的結(jié)合模式,其準確性取決于多重因素,包括模型的預(yù)測能力、蛋白質(zhì)和配體的特性,以及結(jié)合模式的復(fù)雜性。蛋白質(zhì)在與藥物或配體結(jié)合時可能會發(fā)生顯著的構(gòu)象變化,這種“誘導(dǎo)配合”(inducedfit)現(xiàn)象意味著靜態(tài)的蛋白質(zhì)結(jié)構(gòu)可能無法完全揭示藥物結(jié)合時的真實狀態(tài)。有些藥物或配體可能會通過與蛋白質(zhì)結(jié)合改變其結(jié)構(gòu),特別是在與多個亞單位或復(fù)雜結(jié)構(gòu)域相互作用時,AlphaFold通常不能直接預(yù)測這些效應(yīng)。在實際應(yīng)用中,AlphaFold提供的蛋白質(zhì)結(jié)構(gòu)通常與分子對接和分子動力學(xué)等其他計算方法結(jié)合使用,以更準確地預(yù)測和分析藥物/配體的結(jié)合模式,提高預(yù)測的準確性和可靠性。
需要注意的是,任何預(yù)測模型都需要通過與實驗技術(shù)的結(jié)果相結(jié)合來驗證和優(yōu)化預(yù)測結(jié)果。藥物發(fā)現(xiàn)是一個綜合性很強的領(lǐng)域,需要依靠跨學(xué)科的方法和多源數(shù)據(jù)的整合,以確保所發(fā)現(xiàn)的藥物候選分子的效力和安全性。
AlphaFold對于捕捉動態(tài)性和復(fù)雜的蛋白質(zhì)-蛋白質(zhì)或蛋白質(zhì)-小分子相互作用的能力有限;在預(yù)測這些修飾對蛋白質(zhì)結(jié)構(gòu)的影響方面有限;對于大型蛋白質(zhì)復(fù)合物或非常復(fù)雜的蛋白質(zhì)網(wǎng)絡(luò),其預(yù)測能力可能會降低。系統(tǒng)生物學(xué)、代謝途徑、基因表達調(diào)控等方面的因素也對藥物發(fā)現(xiàn)至關(guān)重要,而這些是AlphaFold目前無法直接解決的問題。
AlphaFold能通過快速準確地確定蛋白質(zhì)結(jié)構(gòu),更快地識別新的藥物靶點,來加速藥物的設(shè)計過程。對已知蛋白質(zhì)結(jié)構(gòu)的深入理解,可以幫助科學(xué)家發(fā)現(xiàn)現(xiàn)有藥物的新用途。
AlphaFold的局限性和待改進之處主要是,對于捕捉這種動態(tài)性和復(fù)雜的蛋白質(zhì)-蛋白質(zhì)或蛋白質(zhì)-小分子相互作用的能力有限;在預(yù)測這些修飾對蛋白質(zhì)結(jié)構(gòu)的影響方面有限;對于大型蛋白質(zhì)復(fù)合物或非常復(fù)雜的蛋白質(zhì)網(wǎng)絡(luò),其預(yù)測能力可能會降低。系統(tǒng)生物學(xué)、代謝途徑、基因表達調(diào)控等方面的因素也對藥物發(fā)現(xiàn)至關(guān)重要,而這些是AlphaFold目前無法直接解決的問題。
長遠來說,以人工智能為基礎(chǔ)的蛋白質(zhì)結(jié)構(gòu)預(yù)測,對于藥物發(fā)現(xiàn)的意義是深遠的,AlphaFold只是人們邁出的重要一步。
傳統(tǒng)的藥物發(fā)現(xiàn)過程通常耗時且成本高昂。人工智能的應(yīng)用有可能顯著縮短藥物從發(fā)現(xiàn)到上市的時間,并降低相關(guān)的研發(fā)成本,尤其對于某些長期以來難以解析結(jié)構(gòu)的蛋白質(zhì),如某些膜蛋白,人工智能方法提供了新的解決途徑。這些蛋白質(zhì)往往是重要的藥物靶點,AI的應(yīng)用可以促進這些領(lǐng)域藥物研究的進展。除此之外,AI的應(yīng)用還激勵了計算生物學(xué)、結(jié)構(gòu)生物學(xué)、藥物化學(xué)等多個學(xué)科之間的合作,推動了這些領(lǐng)域的綜合發(fā)展。
信息來源:中國醫(yī)藥報
聲明:本文系轉(zhuǎn)載內(nèi)容,版權(quán)歸原作者所有,涉及作品問題,我們將在第一時間刪除!