目錄
2024 年,諾貝爾化學獎頒給了 David Baker、Demis Hassabis 和 John Jumper,表彰他們在蛋白質結構預測和設計上的突破性貢獻。其中 Hassabis 和 Jumper 代表的正是 DeepMind 的 AlphaFold 團隊。這個結果,在 AI 研究圈裡幾乎沒有人覺得意外。
TL;DR
AlphaFold 用深度學習解決了「蛋白質折疊問題」——給定一條氨基酸序列,預測其在三維空間中的實際形狀。這個問題困擾結構生物學家超過 50 年,AlphaFold2 在 2020 年的 CASP14 競賽中以壓倒性的精準度讓其他方法相形失色,改變了整個領域的走向。
蛋白質折疊問題是什麼
蛋白質是由氨基酸序列組成的分子,序列決定結構,結構決定功能。問題在於:從序列到三維結構之間存在天文數字的可能摺疊方式(Levinthal’s paradox),實驗方法(X 光晶體學、冷凍電子顯微鏡)費時費力,一個蛋白質可能需要數年才能完成結構解析。
長期以來,計算方法試圖從已知結構「推算」未知蛋白,但精準度遠不如實驗。AlphaFold2 出現之前,最好的計算方法在困難蛋白上的 GDT 分數(全域距離測試,100 為完美)大約落在 60–70,而 AlphaFold2 直接跳到 90+,幾乎追平實驗精準度。
AlphaFold2 的技術核心
AlphaFold2 不是單純把「序列丟進神經網路看看輸出什麼」,它的架構針對這個問題有深度的設計:
多序列比對(MSA)作為輸入
演化壓力是結構資訊的天然壓縮。如果兩個生物的蛋白質在演化上相關,同一位置的氨基酸往往一起突變(共演化)。AlphaFold2 把跨物種的序列比對矩陣當作核心輸入,讓模型能「讀出」哪些位置在三維空間中彼此靠近。
Evoformer 模組
AlphaFold2 的骨幹是 Evoformer,一個交替更新序列表示(MSA representation)和殘基對表示(pair representation)的 Transformer 堆疊。序列資訊更新殘基對的距離估計,殘基對資訊反過來精煉序列的注意力模式,兩者在 48 層中反覆迭代。
結構模組(Structure Module)
從 pair representation 中提取的幾何資訊,進入一個以剛體(rigid body)表示每個氨基酸朝向的模組,直接輸出原子座標。整個過程是端對端可微分的,可以用實驗結構直接監督訓練。
graph LR
A[氨基酸序列] --> B[多序列比對 MSA]
A --> C[模板搜索]
B --> D[Evoformer x48]
C --> D
D --> E[Pair Representation]
E --> F[Structure Module]
F --> G[原子座標 + 信心分數 pLDDT]
為什麼這件事真的重要
藥物開發的加速:很多藥物靶點是蛋白質。以前要確認一個蛋白的結構,必須等實驗結果,現在用 AlphaFold 可以在幾分鐘內得到高可信度的預測結構,大幅縮短早期藥物發現的週期。
AlphaFold Database:DeepMind 和 EMBL-EBI 合作,用 AlphaFold 預測了超過 2 億個蛋白質的結構,涵蓋幾乎所有已知物種的蛋白組,全部開放免費存取。這相當於一夜之間把結構生物學的知識庫擴大了幾十倍。
擴展到蛋白質設計:AlphaFold 的後繼者 RFdiffusion、ProteinMPNN 等工具,開始反過來做「從目標結構設計序列」,這是 David Baker 獲獎的核心貢獻。從預測到設計,AI 在分子生物學的角色從旁觀者變成了設計師。
AlphaFold3 和後續發展
2024 年 AlphaFold3 發布,將預測範圍從蛋白質擴展到 DNA、RNA、配體(小分子)等,可以預測蛋白質與其他分子的複合物結構。這對於理解藥物如何與靶點結合特別關鍵。不過 AlphaFold3 的完整程式碼並未像 AlphaFold2 一樣完全開源,引發了一些學術界的討論。
跟傳統方法的差別
| 方法 | 適用範圍 | 精準度 | 時間成本 |
|---|---|---|---|
| X 光晶體學 | 大多數蛋白 | 最高(原子級) | 數月至數年 |
| 冷凍電子顯微鏡 | 大型複合物 | 高(依樣本而定) | 數週至數月 |
| 同源建模(傳統計算) | 有相似模板的蛋白 | 中(模板依賴) | 數小時 |
| AlphaFold2 | 幾乎所有單鏈蛋白 | 高(pLDDT > 90 可信) | 數分鐘至數小時 |
AlphaFold 不是要取代實驗方法,而是讓研究者能夠快速篩選和優先排序,把昂貴的實驗資源用在最值得驗證的目標上。
小結
AlphaFold 獲得諾貝爾獎,代表的不只是一個模型的成功,而是深度學習作為科學工具的成熟。它證明了 AI 可以在有深度結構的科學問題上——而不只是感知任務——做出真正突破性的貢獻。接下來值得觀察的是 AlphaFold3 的影響,以及 AI 是否能在其他生物化學預測任務(酵素功能、藥物毒性)上複製同樣的成功。
參考資料
相關標籤
相關文章
AlphaFold:解決了生物學 50 年難題的 AI,以及它為什麼贏得諾貝爾獎
AlphaFold 在 2020 年以接近實驗測定精度解決了蛋白質折疊問題,2024 年為 Demis Hassabis 和 John Jumper 贏得諾貝爾化學獎。其資料庫現已包含 2 億+ 個蛋白質結構,正在加速藥物開發和材料科學研究。
Demis Hassabis 與 DeepMind 的路徑:從棋盤到諾貝爾獎的 AI 突破圖譜
DeepMind 在 Demis Hassabis 帶領下的核心策略是:用遊戲環境訓練出的泛化推理能力,解決科學上最難的現實問題。AlphaFold、AlphaGeometry、AlphaDev、GNoME 是這個策略最具體的成果。
AlphaProof:DeepMind 用神經符號 AI 解開奧林匹克數學題
DeepMind 的 AlphaProof 結合語言模型與強化學習,在 2024 年國際數學奧林匹克中解出 6 題中的 4 題,達到銀牌水準——這是 AI 第一次在形式化數學推理上接近頂尖人類選手。