深度學習定制新蛋白質
發布時間:2022-11-03 16:25:41 | 來源:【中國生物技術發展中心 2022-10-31】
本文轉自中國生物技術發展中心,轉發僅為學習交流,若侵犯版權請聯系小編刪除。
Alphaflod和Rosettafold等深度學習模型的開發使得基于蛋白質氨基酸序列預測蛋白質結構取得重大進展。然而,通過蛋白質結構逆向設計氨基酸序列仍是難點。針對這一難點,科學家們試圖開發新型的深度學習算法幫助研究人員解決蛋白質逆向問題。
近日,來自美國華盛頓大學的研究團隊在《Science》發表題為“Robust deep learning – based protein sequence design using ProteinMPNN”的研究論文,開發了一種基于深度學習的蛋白質序列設計方法,適用于單體、環狀低聚物、蛋白質納米顆粒和蛋白質-蛋白質界面等設計領域。
研究人員從具有3個編碼器和3個解碼器以及128個隱藏維度的消息傳遞神經網絡(MPNN)開始,將蛋白質骨架特征-Ca-Ca原子之間的距離,相對-Ca-Ca-Ca框架方向和旋轉,以及骨架二面角作為輸入,以自回歸的方式預測從N到C末端的蛋白質序列。針對應用于單鏈和多鏈的設計問題,研究團隊使用了靈活的解碼順序來固定相應位置集合中的殘差恒等式;用非正規化概率與一些正負數的線性組合來提升或降低特定主干狀態,以實現明確的正負序列設計。這種多鏈和對稱感知模型的架構稱之為ProteinMPNN。實驗評估結果表明,ProteinMPNN的高實驗設計成功率和計算效率,適用于幾乎所有蛋白質序列設計問題。從折疊到天然蛋白質主干的觀察結果表明,ProteinMPNN算法可有效改善重組表達天然蛋白質的表達性和穩定性。這一方法的提出使得深度學習可以更準確、更快速地創建蛋白質分子,有利于研發更多新的疫苗、療法和生物材料。
原文鏈接:https://www.science.org/doi/10.1126/science.add2187
注:此研究成果摘自《Science》,文章內容不代表本網站觀點和立場,僅供參考。