行業(yè)動(dòng)態(tài)

       2026年理論物理所重要科研進(jìn)展系列(六):細(xì)胞表型轉(zhuǎn)化的年理信息流形

【ZiDongHua 之“自動(dòng)化學(xué)院派”標(biāo)注關(guān)鍵詞:中科院理論物理所,細(xì)胞表型轉(zhuǎn)化,論物理所列細(xì)流形生物信息學(xué)】

2026年理論物理所重要科研進(jìn)展系列(六):細(xì)胞表型轉(zhuǎn)化的重科展系信息流形

細(xì)胞如何從一種狀態(tài)轉(zhuǎn)變?yōu)榱硪环N狀態(tài)(即細(xì)胞表型轉(zhuǎn)化,Cell Phenotype Transition,研進(jìn) CPT),一直是胞表發(fā)育生物學(xué)、疾病發(fā)生(如癌癥轉(zhuǎn)移)等領(lǐng)域的型轉(zhuǎn)信息核心問(wèn)題。近年來(lái),年理單細(xì)胞RNA測(cè)序技術(shù)的論物理所列細(xì)流形爆發(fā)提供了海量數(shù)據(jù),但如何從高維的重科展系基因數(shù)據(jù)中提取出真正具有物理和幾何意義的動(dòng)力學(xué)規(guī)律,始終是研進(jìn)橫亙?cè)诳茖W(xué)家面前的一道難題。

盡管細(xì)胞包含成千上萬(wàn)個(gè)基因,胞表但受到底層基因調(diào)控網(wǎng)絡(luò)的型轉(zhuǎn)信息嚴(yán)格約束,細(xì)胞表型轉(zhuǎn)化的年理實(shí)際動(dòng)力學(xué)是被限制在低維流形上的。然而,論物理所列細(xì)流形現(xiàn)有的重科展系單細(xì)胞數(shù)據(jù)分析多依賴(lài)于降維可視化工具比如t-SNE、UMAP,Diffusion maps,但這些方法在將高維數(shù)據(jù)投影到二維或三維空間時(shí),雖然盡可能保留了拓?fù)浣Y(jié)構(gòu),卻扭曲了流形真實(shí)的內(nèi)在幾何性質(zhì)。距離和鄰域的扭曲會(huì)導(dǎo)致研究者在 2D 圖上憑肉眼觀察到的細(xì)胞發(fā)育軌跡或分化路徑可能與高維空間中的真實(shí)動(dòng)力學(xué)過(guò)程完全背離。

針對(duì)這一挑戰(zhàn),本研究提出了一種名為SCIM(Single Cell Information Manifolds,單細(xì)胞信息流形)的全新理論框架。該研究首次將“信息幾何(Information Geometry)”引入單細(xì)胞演化動(dòng)力學(xué)分析中,利用高斯嵌入神經(jīng)網(wǎng)絡(luò)將單細(xì)胞基因表達(dá)譜轉(zhuǎn)化為多元高斯分布,從而在概率空間中自然地定義 Fisher 信息度規(guī),成功為細(xì)胞表型轉(zhuǎn)化的低維流形建立了黎曼度規(guī)。該方法突破了傳統(tǒng)降維算法僅能用于可視化的局限,首次實(shí)現(xiàn)了對(duì)細(xì)胞表型轉(zhuǎn)化流形內(nèi)蘊(yùn)幾何屬性的定量監(jiān)測(cè)。

運(yùn)用這一方法,我們發(fā)現(xiàn)流形上低曲率區(qū)域的細(xì)胞對(duì)應(yīng)于細(xì)胞命運(yùn)決定關(guān)鍵期、高度不穩(wěn)定的過(guò)渡態(tài)細(xì)胞。SCIM首次將RNA速率與Fisher度規(guī)相結(jié)合,計(jì)算出了每個(gè)細(xì)胞的“信息速度”。作為衡量分布變化快慢的信息速度,可用于表征細(xì)胞狀態(tài)變化的快慢。研究發(fā)現(xiàn)流形上低曲率區(qū)域的細(xì)胞具有高信息速度,反映了過(guò)渡態(tài)細(xì)胞的動(dòng)力學(xué)性質(zhì),并揭示了細(xì)胞表型轉(zhuǎn)化類(lèi)似于廣義相對(duì)論“時(shí)空引導(dǎo)物質(zhì)運(yùn)動(dòng)”的特性,即不同體系都體現(xiàn)了“流形幾何結(jié)構(gòu)引導(dǎo)細(xì)胞動(dòng)力學(xué)”的規(guī)律。

對(duì)復(fù)雜系統(tǒng)中臨界點(diǎn)的研究至今仍是一個(gè)活躍的研究領(lǐng)域。信息幾何及Fisher信息,為刻畫(huà)相變過(guò)程提供了一種強(qiáng)有力的手段;由于無(wú)需預(yù)先定義哈密頓量或系綜函數(shù),該方法可輕松適用于非平衡系統(tǒng)。因此,SCIM模型不僅為分析單細(xì)胞表型轉(zhuǎn)化提供了一個(gè)理論框架,更有望揭示廣泛的復(fù)雜系統(tǒng)轉(zhuǎn)變過(guò)程中所蘊(yùn)含的深層原理。

相關(guān)研究成果以“Geometric Quantification of Cell Phenotype Transition Manifolds with Information Geometry”為題,發(fā)表在 Cell Systems 期刊上,為量化復(fù)雜生物系統(tǒng)的非平衡動(dòng)力學(xué)提供了全新的數(shù)學(xué)物理視角。

SCIM框架示意圖

中國(guó)科學(xué)院理論物理研究所王維康副研究員和北京大學(xué)北京國(guó)際數(shù)學(xué)研究中心/數(shù)學(xué)科學(xué)學(xué)院/定量生物學(xué)中心/國(guó)際機(jī)器學(xué)習(xí)中心張磊教授為該論文的共同通訊作者。中國(guó)科學(xué)院理論物理研究所博士生黃淼和北京大學(xué)大數(shù)據(jù)科學(xué)研究中心碩士研究生王宇軒為論文共同一作,論文合作者還包括中國(guó)科學(xué)院理論物理研究所周海軍研究員,博士生肖和與北京大學(xué)數(shù)學(xué)學(xué)院博士生應(yīng)駿達(dá)。

該項(xiàng)研究得到了國(guó)家自然科學(xué)基金以及理論物理專(zhuān)款,國(guó)家重點(diǎn)研發(fā)計(jì)劃、北京自然科學(xué)基金等多項(xiàng)基金項(xiàng)目的支持與資助。