應用數學與交叉科學研究中心生物信息學團隊于2023年11月28日舉行第三十期研究生論壇,小組全體成員和各位導師共同參加。在這次組會上,由兩名研一學生和兩名研二學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。
陳龍:本次報了一篇名為《Algebraic graph-assisted bidirectional transformers for molecular property prediction》的文獻。分子性質預測的能力對于藥物發現、人類健康和環境保護具有重要意義。盡管一些機器學習模型(例如 Transformer 的雙向編碼器)可以通過自監督學習策略将大量未标記的分子數據合并到分子表示中,但它忽略了三維 (3D) 立體化學信息。代數圖,具體來說,元素特定的多尺度加權彩色代數圖,将互補的 3D 分子信息嵌入到圖不變量中。我們通過融合代數圖和雙向變壓器生成的表示以及各種機器學習算法(包括決策樹、多任務學習和深度神經網絡),提出了代數圖輔助雙向變壓器(AGBT)框架。大量的數值實驗表明,AGBT 是分子特性預測的最先進的框架。

孫睿:本次彙報了一篇名為《基于圖神經網絡的空間轉錄組學數據的細胞聚類》的文獻,文章利用空間轉錄組學和圖神經網絡的優勢,利用圖神經網絡引入空間轉錄組學數據的細胞聚類,這是一種基于圖卷積網絡的無監督細胞聚類方法,以改進從頭算細胞聚類和基于策劃細胞類别注釋的細胞亞型發現。基于對5個體外和體内空間數據集的應用,發現空間轉錄組學的細胞聚類方法優于其他空間轉錄組學數據集的空間聚類方法,并且可以從培養細胞的多路錯誤魯棒熒光原位雜交數據中清楚地識别出所有四個細胞周期階段。從增強的序列熒光原位雜交數據中,細胞空間轉錄組學聚類發現了不同微環境下的功能細胞亞型,這些都得到了實驗驗證,激發了關于細胞狀态、細胞類型和微環境之間潛在相互作用的生物學假設。

黎紅豔:本次彙報了一篇名為《Semi-Supervised Neural Architecture Search for Hyperspectral Imagery Classification Method With Dynamic Feature Clustering》的文獻。為了解決隻提供少量的标記樣本情況下,構造更适合給定HSI的網絡結構,而不是利用手動設計的網絡結構進行HSI分類的問題。本文提出了第一個通過神經結構搜索(NAS)構建的半監督HSI分類網絡。具體而言,提出了一個在這次組會上,由一名研一學生、兩名研二學生和一名研三學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。
袁潔:本次彙報的是研究進展——單鍊DNA結構預測的穩定性,在原有的模型基礎上參考tis提供的實驗相關數據,找到原實驗文章的數據。并參考查找到單鍊DNA的穩定性歸因于有力的堆積相互作用和不利的靜電相互作用的相互作用,得知poly(dA)與poly(dT)的結構有一定的區别,dA30中堆積占主導作用,dT30中堆積作用與靜電作用會相抵消。

孫睿:本次彙報了研究進展——彙報了現有的空間轉錄組數據聚類分析的部分方法,并對幾種方法進行了比較,着重分享了spicemix方法,一種基于概率、潛在變量建模的可解釋方法,用于空間轉錄組數據的空間信息和基因表達的聯合分析。仿真和實際數據評估表明,SpiceMix在細胞類型及其空間格局的推斷方面比現有方法有顯著提高。通過應用seqFISH+、STARmap和Visium獲取的人類和小鼠大腦區域的空間轉錄組數據,SpiceMix可以增強對複雜細胞身份的推斷,揭示可解釋的空間宏基因,揭示分化軌迹。SpiceMix是一個用于研究複雜組織中細胞類型組成和細胞空間組織的空間轉錄組數據的通用分析框架。

柯璐:本次彙報的是一篇文獻《Stochastic model for protein flexibility analysis》, 蛋白質柔性是一種内在屬性,在蛋白質功能中起着重要作用。蛋白質柔性的計算分析對于蛋白質功能預測、大分子柔性對接和合理藥物設計至關重要。目前大多數蛋白質柔性分析方法都基于哈密頓力學。本文引入了一個随機模型來研究蛋白質柔性。基本思想是分析滿足主方程的擾動蛋白結構概率的自由誘導衰減。由包括單調遞減徑向基函數的概率密度估計器構建轉移概率矩陣。該方法不需要構造任何哈密頓函數,也不需要矩陣對角化。所提出的随機模型為三組蛋白質數據集提供了B因子的最佳預測。

王嘉琦:本次彙報了一篇文獻《Geometric diffusions as a tool for harmonic analysis and structure definition of data: diffusion maps》,高維空間中圖形和數據集的幾何組織是統計數據分析中的一個中心問題,在連續歐幾裡得條件下,諧波分析的工具,如傅立葉分解、微波或小波和僞微分算子的譜分析,在壓縮、去噪和密度估計等許多領域都被證明是非常成功的。本文将多尺度諧波分析擴展到離散圖和子集,使用擴散半群來定義和生成複雜結構的多尺度幾何,這個框架概括了牛頓範式的某些方面,其中系統的局部無窮小轉移通過積分導緻全局宏觀描述,全局函數由微分方程表征。

— 學生彙報照片展示 —



