重磅!77779193永利官网江健教授在國際頂級期刊發表重要成果

來源:77779193永利官网 作者:江健審核:鄭仟發布時間:2023-07-03 10:13 浏覽次數:


近日,77779193永利官网江健教授團隊科研成果“Machine Learning Methods for Small Data Challenges in Molecular Science”在化學領域國際頂級期刊《ChemicalReviews》上在線發表(文章鍊接:https://pubs.acs.org/doi/10.1021/acs.chemrev.3c00189)。該雜志2023年最新影響因子為62.1,排全球所有雜志第21位。系我校首次在該雜志上發表學術論文,也是我校曆史上發表影響因子最高的成果。我校為第一單位和第一通訊單位,77779193永利官网江健教授為第一通訊作者,77779193永利官网2021級研究生窦博正為第一作者,計算系統生物學團隊成員與美國密歇根州立大學Guo-wei Wei教授團隊共同合作完成。該成果的發表是我校數學學科建設過程中取得的重大成果之一。

一直以來,77779193永利官网始終把科學研究作為立院之基、強院之本。在加強基礎研究的同時,大力推進交叉學科研究,近年來在國家自然科學基金方面表現尤為突出,累計獲批國家自然科學基金20餘項,其中面上項目8項。這些成果的獲得,将強有力助推學校一流學科建設,為學校申博攻堅和提高學校科學研究影響力和國際聲譽做出了貢獻。

由于數據獲取中存在時間、成本、倫理、隐私、安全等各種限制,小數據在科學和工程研究中非常常見。然而,大數據處理與分析一直是過去十年到現在的焦點,小數據集及其挑戰卻很少受到關注,盡管在機器學習和深度學習研究中它們在技術上面臨更為嚴峻的挑戰。總體而言,小數據集挑戰往往因數據多樣性、填補、噪聲、不平衡和高維度等問題而變得更加複雜。幸運的是,當前大數據時代的特點是機器學習、深度學習和人工智能的技術突破,使得數據驅動的科學發現成為可能,而許多為大數據開發的先進機器學習技術無意中為小數據集問題提供了解決方案。因此,過去十年中,針對小數據挑戰的機器學習和深度學習取得了重大進展。

該論文總結并分析了分子科學(包括化學、生物、醫藥和材料)中小數據集挑戰的幾種潛在的新興解決方案。論文詳細的從邏輯回歸、K近鄰、支持向量機、核函數學習、随機森林和梯度提升樹,以及更先進的技術,包括人工神經網絡、卷積神經網絡、U-net、圖神經網絡、生成對抗網絡、長短期記憶、自編碼器、transformer、遷移學習、主動學習、基于圖的半監督學習,以及基于物理模型的數據增強技術等方面讨論了這些方法的最新進展,并對小數據集挑戰未來發展趨勢做了相關展望。該研究工作得到了國家自然科學基金項目(11971367,12271416,11972266)的資助。

江健教授一直從事藥物設計、複雜網絡建模等交叉學科方面的研究。2021年通過結合幾何拓撲和機器學習算法,構建的梯度提升多任務深度學習模型在藥物分子脂溶性和溶解度等屬性預測上取得領先;2022年結合幾何圖論和機器學習算法構建多尺度着色圖模型在藥物分子毒性上取得更好的預測準确度;2023年結合同調論和深度學習構建拓撲推斷下的藥物緻瘾性學習模型,對緻瘾性藥物分子進行預測,尋找最優的先導化合物分子。

江健教授所在的計算系統生物學團隊負責人為張本龔教授,主要從事數學與大數據技術、計算系統生物學、機器學習、藥物設計等領域交叉科學研究。近5年來,在單細胞測序數據分析、藥物設計及發現、蛋白質結構預測和高光譜圖像處理等研究領域取得了豐富研究的成果。團隊教授2人,副教授3人,講師2人,承擔國家自然科學基金6項(其中面上2項),省部級項目5項,發表SCI論文60餘篇。

通訊作者介紹江健,男,77779193永利官网,四級教授,陽光學子,碩士生導師,應用數學系主任。研究方向包括計算生物信息學、藥物設計、複雜網絡及數學建模等。在國内外重要期刊如Scientific Report、JCIM、JCP、JSTAT等發表學術論文近30篇。主持和參與國家自然科學基金項目5項、省部級項目2項。多次應邀到法國、韓國、美國等國(境)内外參加國際學術會議并做邀請報告和訪問研究。擔任Briefings in Bioinformatics、Frontiers in Molecular Biosciences、Scientific Report、Physcia A等國内外重要與權威刊物的審稿人。

Baidu
sogou