應用數學與交叉科學研究中心生物信息學團隊于2024年3月第3次組會按期舉行,小組全體成員和各位導師共同參加。在這次組會上,由一名研二學生和六名研三學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。
王夢園:本次彙報了畢業論文的主要内容。論文題目為:《基于單細胞轉錄組測序數據的基因轉錄爆發動力學推薦》,文章主要介紹了兩個主要工作:1.研究總結并分析了熱門的單細胞轉錄組測序數據缺失值插補方法,并給出推薦方案;2.通過數據驅動和模型驅動相結合的模式結合單細胞轉錄組測序數據與基因表達模型推斷轉錄爆發動力學特征,并在模拟數據集和真實數據集上進行驗證,最後分析了基因表達和轉錄爆發的内在關系。

吳昊:本次彙報了畢業論文的研究内容。RNA分子具有重要的生物學功能,然而現有的實驗方法費時費力,雖然基于物理原理的粗粒化模型可以較為快速的預測出RNA結構的粗粒化結構,但粗粒化模型缺乏原子細節,這極大的限制了它的應用性。現有的幾種全原子還原方法又各自存在一定的局限性,基于現狀我們提出了一種新的基于多核苷酸片段組裝的直接方法,以快速、準确地實現粗粒化結構的全原子還原。

韓長鋒:本次彙報了畢業論文的研究内容,如下:細胞命運決定是胚胎發育和多細胞生物形成的關鍵過程,研究細胞命運決定的機制對理解細胞内部調控至關重要。細胞增殖,分化和重編程等細胞過程由複雜的基因調控程序控制,但細胞通過整合各種信号并執行基因調控指令做出自己的命運決定。本研究旨在深入探究細胞命運決策的内在機制,特别是影響基因表達量變化的關鍵因素。與傳統的細胞命運決策研究路線不同,本文拟采用模型與數據相結合的方法,綜合深度學習和化學主方程等數學計算機方法,對細胞命運決策過程進行了系統的分析。

李成:本次彙報了畢業論文的研究内容。為了能夠解決緩解估計定量未剪接mRNA和剪接mRNA豐度對估計RNA速度的影響,并且不需要複雜的額外的特征信息來增強RNA速度的估計,我們改進了RNA速度模型,設計一個新的RNA速度模型WF-velo,具有簡單并能提高單細胞測序數據的利用率,用完整的細胞基因表達特征信息來估計RNA速度,并推斷細胞分化軌迹。

窦博正:本次彙報了畢業論文的研究内容。藥物分子數據,特别是疼痛及藥物成瘾相關的數據涉及多種藥物分子屬性及研究内容,這些數據對于藥物研發、藥物活性預測和藥物分子虛拟篩選等研究至關重要。随着人工智能技術的快速發展,機器學習算法在藥物分子數據分析方面具有廣泛的應用。此外,以代數拓撲理論為核心的拓撲數據分析方法在藥物設計領域取得巨大成功,提高了藥物分子虛拟篩選的準确度和效率。因此,我們結合機器學習、深度學習以及代數拓撲,通過收集和分析藥物成瘾數據和疼痛相關分子數據,篩選治療藥物成瘾和疼痛的先導化合物分子,并詳細介紹了用于處理小樣本藥物數據集的機器學習方法。

袁潔:本次彙報了畢業論文的研究内容。針對以前開發的一個DNA粗粒化模型有進一步的發展,增加了序列效應依賴的單鍊内相鄰堿基之間的堆積相互作用,以預測單鍊DNA結構及其柔性中的序列效應。為了驗證該模型,針對不同長度(8-100nt)的單鍊Poly(dA)和Poly(dT),利用該模型預測了其在不同離子條件下的構象變化,并計算回轉半徑随序列長度及離子濃度的變化關系。還進一步利用該模型研究了序列及長度、離子濃度等對單鍊DNA的持久長度的影響。

柯璐:本次彙報了一篇文獻《Fast and anisotropic flexibility-rigidity index for protein flexibility and fluctuation analysis》,使用适當的數據集引入快速 FRI (fFRI) 算法,與原始 FRI 算法的 O(N2) 和 GNM 的 O(N3) 相比,所提出的 fFRI 的計算複雜度為 O(N),其中 N 是原子數。另外,引入各向異性 FRI (aFRI) 算法來進行生物分子的運動分析。與完全全局且黑塞矩陣中有 3N × 3N 元素的 ANM 不同,所提出的 aFRI 算法具有自适應 黑塞矩陣,其範圍從完全全局到完全局部。盡管存在局部化,但三組特征向量中仍存在集體運動。此外,進一步分析 FRI 方法在蛋白質 B 因子預測方面的性能。為此,檢查了與四個相關函數相關的 FRI 算法的準确性,并對 FRI 和 fFRI 與其他前沿方法(即 NMA 和 GNM)進行了比較研究。

— 學生彙報照片展示 —



