77779193永利官网2024年第五十八期研究生論壇順利舉辦

來源:77779193永利官网 作者:王嘉琦審核:鄭仟發布時間:2024-04-22 15:41 浏覽次數:


應用數學與交叉科學研究中心生物信息學團隊于2024年4月第3次組會按期舉行,小組全體成員和各位導師共同參加。在這次組會上,由兩名研一學生和一名研二學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。

李莎莎:本次彙報了近期的工作進展:RNA分子在生物體内有着非常重要的功能,而這些功能和它的三維結構有緊密的聯系,RNA多分支環是RNA分子中常見并且比較特殊的一類結構單元,分子間的各種相互使得它的不同分支之間會發生共軸堆積相互作用,因此RNA多分支環中哪兩個分支會發生共軸堆積成了我們關注的問題之一。因此為了對多分支環共軸堆積進行預測,我們從已知三維結構的非冗餘RNA中提取了三分支環、四分支環以及高階分支環所拆分得到的二分支數據,以分支環的二級結構信息作為特征,共軸堆積情況作為标簽構建數據集。并通過随機森林、SVM、KNN、xgboost、lightGBM、GBDT、Adaboost等算法對數據集進行訓練并測試,三分支環的測試精度可達到0.86、四分支環的測試精度可達到0.93,對于更高階的分支所拆成的二分支數據的預測精度也可以達到0.9以上,相較于Scklick的三分支81%、四分支77%、高階分支60%,在我們新增數據量和新增特征之後預測精度有一定的提升。

和琰:本次組會彙報了一篇文獻《A relay velocity model infers cell-dependent RNA velocity》。RNA速度提供了一種從單細胞RNA測序(scRNA-seq)數據推斷細胞狀态轉變的方法。傳統的RNA速度模型在scRNA-seq實驗中推斷出所有細胞的普遍動力學,導緻在細胞狀态的多階段和/或多譜系轉變的實驗中表現不可預測,因為所有細胞的相同動力學速率的假設不再适用。在這裡,我們提出了cellDancer,這是一個可擴展的深度神經網絡,它局部推斷每個細胞的速度,然後接力一系列局部速度,以提供速度動力學的單細胞分辨率推斷。在仿真基準測試中,cellDancer在多動态狀态、高失分率數據集和稀疏數據集上表現出魯棒性。我們發現cellDancer克服了現有RNA速度模型在模拟成熟紅細胞和海馬發育方面的局限性。此外,cellDancer提供了細胞特異性的轉錄、剪接和降解率預測,我們認為這是小鼠胰腺細胞命運的潛在指标。

柯璐:本次彙報了一篇文獻《A topological approach for protein classification》,探讨了使用持續同源作為蛋白質分類的獨立工具的潛力。為此,提出一種基于分子拓撲指紋的支持向量機(MTF-SVM)分類器。具體來說,僅根據蛋白質拓撲指紋構建機器學習特征向量,蛋白質拓撲指紋是過濾過程中生成的拓撲不變量。為了驗證當前的 MTF-SVM 方法,考慮四種類型的問題。首先,利用甲型流感病毒的 M2 通道蛋白研究蛋白質-藥物結合。在區分藥物結合和未結合的 M2 通道方面實現了 96% 的準确度。其次,研究了使用 MTF-SVM 對松弛和拉緊形式的血紅蛋白分子進行分類,并獲得了約 80% 的準确度。案例1和案例2檢驗了基于拓撲指紋的分類方法在區分相同蛋白質不同構象方面的性能。第三,使用900個蛋白質進行所有α、所有β和α-β蛋白質結構域的鑒定。發現該鑒定的成功率平均為85%,這驗證了該方法在捕捉局部二級結構差異方面的有效性。最後,将本技術應用于1357個樣本的蛋白質超家族的55個分類任務和11944個樣本的246個分類任務。平均準确率達到82%和73%。檢驗了該方法局部和全局拓撲特征的結合用于區分不同蛋白質超家族的能力。本研究将計算拓撲确立為蛋白質分類的獨立且有效的替代方案。

— 學生彙報照片展示 —

Baidu
sogou