應用數學與交叉科學研究中心生物信息學團隊于2024年3月第2次組會按期舉行,小組全體成員和各位導師共同參加。在這次組會上,由一名研一學生和兩名研二學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。
張春煥:本次組會彙報了一篇文獻《Persistent homology analysis of protein structure,flexibility and folding》。蛋白質是生物體中最重要的生物分子。了解蛋白質的結構、功能、動力學和轉運是生物科學中最具挑戰性的任務之一。本文首次将持久司調引入到分子拓撲指紋絞的提取中。分子拓撲指紋被用于蛋白質的表征、鑒定和分類。基于蛋白質緊密度、剛性和連通性之間的相關性,提出了一個由持久拓撲不變量生成的累積條長度,用于蛋白質靈活性的定量建模。并提出了一種基于相關矩陣的過濾方法。這種方法可以準确預測蛋白質b因子分析中使用的最佳特征距離。最後,利用拓撲指紋表征蛋白質折疊過程中的拓撲進化,定量預測蛋白質折疊的穩定性。這項工作揭示了蛋白質的拓撲-功能關系。

孫睿:本次組會彙報了一篇文獻《A spatial variable gene filtrate method based on Wasserstein distance》。識别空間可變基因(SVGs)是連接分子細胞功能與組織表型的關鍵。空間解析轉錄組學(SRT)在二維或三維空間坐标上捕獲細胞水平的基因表達,可以高效地獲得細胞的基因表達數據和空間位置信息。根據SRT獲得的數據可以用來識别空間可變基因,然而,目前的計算方法可能無法準确識别關鍵的SVGs,并且往往無法處理三維空間轉錄組數據。在這裡我們提出了一種識别SVGs的方法(SWDG),通過比較基因表達量分布和其均值分布的wasserstein距離來确定SVGs。該方法的準确性、魯棒性分别在4個2D數據集和4個3D數據集上得到了驗證,其中包含4個真實的實驗數據和4個計算機生成的模拟數據。真實的數據集由4種不同的測序方法得到,涉及到生物體的多個組織。

郭成:本次彙報了RNA殘基接觸預測的近期工作,首先,核糖核酸(RNA)是生物分子的關鍵分子之一,在細胞中并在許多生物活動中起着重要作用。因為RNA的功能與其三維(3D)結構密切相關,計算方法可以成為一種強大的工具來預測和分析來補充實驗工作RNA結構。而間接預測的信息可以集成到計算建模工具中。通過統計方法從RNA家族的多序列比對(MSA)推斷出的核苷酸的空間接近信息也可以被利用, 作為空間約束的分子建模工具。在這裡我們将核酸序列數據庫随機拆分成若幹份,分别重新構建序列數據庫,分别搜索相似同源家族序列。得到4個多序列比對,通過DCA方法得到4個殘基接觸結果,最後通過全卷積網絡訓練來得到一個新的殘基接觸結果,在訓練集和一個測試集上進行測試,結果還存在一定的問題,可能存在的問題還需要再去修改。

— 學生彙報照片展示 —


