應用數學與交叉科學研究中心生物信息學團隊于2025年3月5日第1次組會按期舉行,小組全體成員和各位導師共同參加。在這次組會上,由兩名研一學生和兩名研二學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。
李代欣:本次組會彙報了一篇文獻《Evaluation of AlphaFold 3’s Protein−Protein Complexes for Predicting Binding Free Energy Changes upon Mutation》。這篇文獻評估了AlphaFold 3(AF3)在預測蛋白質-蛋白質複合物結構方面的表現,特别是其在預測突變引起的結合自由能(BFE)變化方面的能力。AF3作為AlphaFold的升級版,不僅能夠預測單個蛋白質結構,還能夠預測蛋白質-蛋白質複合物的結構,這是計算生物學中的重要進展。實驗使用SKEMPI 2.0數據庫評估了AF3預測的蛋白質-蛋白質複合物結構,該數據庫包含317個蛋白質-蛋白質複合物和8338個突變引起的BFE變化。文章将AF3的性能與以前使用PDB結構的模型進行了比較。AF3在使用多任務拓撲拉普拉斯模型(MT-TopLap)預測BFE變化時達到了0.86的皮爾遜相關系數,這略低于使用PDB結構時達到的0.88。這表明,雖然AF3的預測表現出色,但其預測誤差(RMSE增加了8.6%)略有增加。AF3預測的複合物結構大多數與真實結構對齊良好,但一些複合物的結構不對齊,這些問題未被傳統的性能指标(如ipTM)捕捉到。此外,AF3在預測蛋白質中高度靈活區域或結構域時的表現較差。研究表明,AF3在處理高度靈活的蛋白質或區域時表現較差,這可以通過結構不對齊和高B因子的關聯來證明(高B因子表示蛋白質的柔性區域)。盡管AF3在一些柔性區域的預測中存在挑戰,但整體表現仍然具有競争力,特别是在藥物發現、蛋白質工程和疾病治療等領域。未來,改進AF3的柔性區域預測能力,以及進一步減少RMSE誤差,将增強其在更廣泛的生物學和醫學研究中的應用。此外,結合其他補充技術(如實驗數據)和更高質量的蛋白質複合物數據,可以進一步提高AF3的預測準确性和可靠性。
王桂林:本次彙報了一篇名為《Rapid response to fast viral evolution using AlphaFold 3-assisted topological deep learning》的文獻。本研究提出了一種基于AlphaFold 3(AF3)輔助的拓撲深度學習模型(MT-TopLap),旨在應對病毒快速進化對疫苗和抗體設計的挑戰。該模型通過三步流程進行:首先利用AF3預測病毒蛋白與宿主受體的3D複合物結構,其次提取結構中的拓撲和幾何特征,再結合多任務深度學習進行突變效應預測。核心創新在于将持久拉普拉斯引入病毒進化預測,并通過輕量化遷移學習快速适應新變體數據。該模型在性能驗證中表現出色,能夠替代實驗數據預測突變對結合能力的影響,成功提前預警變體傳播趨勢,并為疫苗設計提供指導。優勢在于加速疫苗研發周期、主動應對變體進化、突破傳統預測方法的局限,為AI驅動的結構生物學提供了新範式,具有廣泛的實際應用前景。
萬智康:本次組會彙報了關于RNA基序的研究思路及進展。RNA基序是具有特定序列或結構模式的RNA片段,廣泛存在于細胞中并與多種生物過程相關,如基因表達調控、蛋白質合成和RNA加工等,其研究對揭示RNA功能和機制具有重要意義。從Rfam數據庫中提取所有RNA家族的序列集合,并從PDB數據庫篩選具有已解析三維結構的RNA序列,确保結構和功能上的代表性。利用MEME工具識别RNA序列中的潛在保守序列基序,并将其與PDB中的三維結構RNA序列比對,識别具有功能意義的關鍵序列。根據三維結構信息進行統計分析,評估基序在RNA折疊與功能中的潛在作用。構建多模态特征集,包括序列保守性、位置特異性得分矩陣(PSSM)、二級結構預測(RNAfold)等生物學特征。通過标準化多源數據,形成統一的特征矩陣,為模型訓練提供輸入,在模型構建與訓練階段,嘗試多種深度學習框架,包括殘差神經網絡(ResNet)、圖神經網絡(GNN)、卷積神經網絡(CNN)和長短期記憶網絡(LSTM),并結合不同模型結構進行交叉驗證與超參數優化。模型訓練過程中,使用Adam優化器與交叉熵損失函數,評估各模型的性能表現,篩選出最佳模型結構。模型性能評估采用真陽率(TPR)、馬修斯相關系數(MCC)、F1分數等多種指标,通過持續的交叉驗證和性能優化,進一步提高模型的泛化能力與預測精度。最終,将高可信度的RNA基序預測結果提交專業數據庫比對驗證,探索其在RNA-蛋白質相互作用中的潛在功能。同時,将研究成果應用于藥物設計和功能性RNA分子工程,推動RNA功能研究與應用的發展。
黎紅豔:本次組會彙報了一篇文獻《Weighted Feature Fusion of Convolutional Neural Network and Graph Attention Network for Hyperspectral Image Classification》,卷積神經網絡(CNN)和圖神經網絡(GNN),如圖注意力網絡(GAT),是兩種經典的神經網絡模型,分别應用于網格數據和圖數據的處理。它們在高光譜圖像分類領域取得了突出的性能,引起了人們的極大興趣。然而,CNN一直面臨着小樣本的問題,GNN必須支付巨大的計算成本,這限制了兩種模型的性能。本文利用基于超像素的GAT和基于像素的CNN的互補特性,提出了用于HSI分類的卷積神經網絡和圖注意力網絡的加權特征融合(WFCG)。我們首先借助基于超像素的編碼器和解碼器模塊建立GAT。然後我們結合注意力機制構建CNN。最後,将特征與兩個神經網絡模型的特征進行加權融合。對三個真實世界HSI數據集的嚴格實驗表明,WFCG可以充分探索HSI的高維特征,并與其他最先進的方法相比獲得有競争力的結果。



