行業(yè)動(dòng)態(tài)

       清華大學(xué)自動(dòng)化系江瑞團(tuán)隊(duì)研究成果入選2025年度“中國(guó)生物信息學(xué)十大進(jìn)展”

【ZiDongHua 之“自動(dòng)化學(xué)院派”標(biāo)注關(guān)鍵詞:清華大學(xué),清華 清華大學(xué)自動(dòng)化系,大學(xué) 生物信息學(xué)】

喜訊!自動(dòng)化系江瑞團(tuán)隊(duì)研究成果入選2025年度“中國(guó)生物信息學(xué)十大進(jìn)展”

導(dǎo)語

2026年3月23日,自動(dòng)中國(guó)《基因組蛋白質(zhì)組與生物信息學(xué)報(bào)(英文)》(Genomics,化系 Proteomics & Bioinformatics, 簡(jiǎn)稱GPB)公布了2025年度“中國(guó)生物信息學(xué)十大進(jìn)展”評(píng)選結(jié)果。清華大學(xué)自動(dòng)化系江瑞教授團(tuán)隊(duì)發(fā)表在《自然·方法》(Nature Methods)期刊的江瑞進(jìn)展論文《單細(xì)胞表觀基因組基礎(chǔ)模型—EpiAgent》(EpiAgent—foundation model for single-cell epigenomics)入選。

單細(xì)胞表觀基因組基礎(chǔ)模型—EpiAgent

表觀基因組是團(tuán)隊(duì)連接DNA序列與人體表型、解析致病機(jī)制的研究關(guān)鍵橋梁。清華大學(xué)自動(dòng)化系江瑞團(tuán)隊(duì)建立了國(guó)際上首個(gè)單細(xì)胞表觀基因組基礎(chǔ)模型EpiAgent,成果原創(chuàng)性地將單個(gè)細(xì)胞的入選百萬調(diào)控元件壓縮為“細(xì)胞語句”,構(gòu)建14億參數(shù)的年度大模型統(tǒng)一解析復(fù)雜的基因調(diào)控規(guī)律。該模型通過獨(dú)創(chuàng)的生物預(yù)訓(xùn)練任務(wù),在涵蓋500萬細(xì)胞、信息學(xué)350億調(diào)控元件的清華自建超大規(guī)模人類染色質(zhì)開放性圖譜(Human-scATAC-Corpus)上完成訓(xùn)練。

EpiAgent不僅使大規(guī)模表觀基因組數(shù)據(jù)整合分析成為可能,大學(xué)更在腫瘤細(xì)胞中實(shí)現(xiàn)了內(nèi)外源擾動(dòng)響應(yīng)與調(diào)控元件虛擬敲除的自動(dòng)中國(guó)精準(zhǔn)推演,從而全面開啟了表觀基因組虛擬細(xì)胞研究與應(yīng)用的新范式。

EpiAgent預(yù)訓(xùn)練數(shù)據(jù)、詞元化過程、模型架構(gòu)及預(yù)訓(xùn)練任務(wù)

推薦理由

首個(gè)單細(xì)胞表觀基因組基礎(chǔ)大模型,通過14億參數(shù)的細(xì)胞壓縮語言模型解決數(shù)據(jù)分析與建模難題,開創(chuàng)了表觀基因組研究新范式。

工具鏈接:

https://github.com/xy-chen16/EpiAgent

https://doi.org/10.5281/zenodo.16562787

原文信息:

Chen X, Li K, Cui X, Wang Z, Jiang Q, Lin J, et al. EpiAgent: foundation model for single-cell epigenomics. Nature Methods 2025;22:2316–2327. PMID: 40999099.

原文鏈接:

https://www.nature.com/articles/s41592-025-02822-z

編輯 | 田佳輝

審核 | 周亞

終審 | 石宗英