應用數學與交叉科學研究中心生物信息學團隊于2025年11月19日第2次組會按期舉行,小組全體成員和各位導師共同參加。在這次組會上,由兩名研二學生和一名研一學生分别彙報自己的研究進展,然後老師與同學們對彙報内容進行學術探讨,并對存在的問題給出相應的指導和建議。
萬智康:本次彙報了一篇文獻,文章提出RNA結構基序是RNA三維結構中反複出現的片段,對RNA的功能多樣性起着關鍵作用。理解這些重複基序組的相似性和差異性,對于深入理解RNA的結構與功能至關重要,雖然人們普遍認為重複結構基序由相同的等排堿基相互作用構成,但這種一緻模式并非所有基序實例都存在,現有的RNA結構基序分析方法可能忽視了堿基相互作用及其相關核苷酸的差異。RNAMotifProfile是一種新型的基序間比對算法,它能從一組結構基序中生成全面的基序譜,涵蓋每個位置的所有堿基相互作用及相關核苷酸,通過采用基于引導樹的方法對輸入基序實例進行結構比對,RNAMotifProfile能夠捕捉重複基序組的相似性和差異性。此外,RNAMotifProfile還可作為基序搜索工具,通過匹配相應基序譜來識别特定基序家族的實例,通過為RNA結構基序家族生成精準全面的特征譜,并實現對這些基序的高效檢索,得以深入理解RNA結構與功能的内在關聯,為RNA工程和治療設計領域開辟了新的應用前景。
韋情晴:本次彙報了一篇文獻,論文提出了 Latent Diffusion Model(LDM),用于解決傳統擴散模型在高分辨率圖像生成中計算量大、訓練和推理成本極高的問題。以往擴散模型直接在像素空間工作,需要處理大量對人眼不敏感的高頻細節,導緻效率低下。LDM 的核心思想是先通過自編碼器将圖像壓縮到一個保留語義但顯著低維的潛空間,然後在潛空間中訓練擴散模型,這樣既減少了運算量,又避免了對無關細節的過度建模,從而使高分辨率圖像生成變得可行。此外,LDM 引入跨注意力機制,使模型能夠靈活結合文本、語義圖等多模态條件,實現文本生成圖像、語義布局生成、超分辨率和圖像修複等任務。實驗結果顯示,LDM 在保持高生成質量的同時大幅降低了訓練與推理成本,并在多個任務上達到或超過現有方法的性能。
彭旭東:本次彙報了一篇文獻,文中提出了一種新的文本增強醫學圖像分割模型LViT,該模型采用了混合的CNN-Transformer結構,并設計了像素級注意力模塊(PLAM),用來更好地整合文本信息,同時保留CNN從圖像中提取局部特征的能力。同時,文章設計了一種指數僞标簽疊代機制(EPI),旨在逐步改進僞标簽,并間接地利用文本信息來優化僞标簽。此外,還設計了LV(語言-視覺)損失,以直接利用文本信息來監督未标記醫學圖像的訓練。為了驗證LViT的性能,該文章構建了三個多模态醫學圖像分割數據集,包含CT圖像和X射線圖像。實驗結果表明,LViT在不同數據集上均取得了優異的分割性能,即使僅使用了部分訓練集标簽,也能獲得與全監督方法相當的性能。


