獼猴屬的食蟹猴(Macaca fascicularis)和恒河猴(Macaca mulatta)是最常用的非人靈長(cháng)類(lèi)實(shí)驗動(dòng)物,因其與人類(lèi)具有較近的親緣關(guān)系(約 2500 萬(wàn)年前分化),而被廣泛用于生物醫學(xué)和人類(lèi)演化研究,尤其在人類(lèi)特有性狀形成、疾病模型及藥物代謝等領(lǐng)域。然而,現有的參考基因組仍存在大量未知序列,特別是著(zhù)絲粒、片段重復(segmental duplications,SD)和核糖體 DNA(rDNA)區域,這限制了對靈長(cháng)類(lèi)演化機制及其生物醫學(xué)價(jià)值的深入探索。
2025 年 2 月 26 日,上海交通大學(xué)毛亞飛課題組與中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng )新中心(神經(jīng)科學(xué)研究所)孫強課題組合作,在 Nature 期刊發(fā)表了題為:Integrated analysis of the complete sequence of a macaque genome 的研究論文。
該研究首次完成了非人靈長(cháng)類(lèi)的端粒到端粒(telomere-to-telomere,T2T)完整基因組組裝,系統解析了獼猴屬與人類(lèi)的大尺度基因組差異,并以 FOLH1 基因家族為關(guān)鍵案例,解釋結構變異如何通過(guò)三維基因組重構調控腦細胞類(lèi)型特異性表達。除此之外,該項研究還揭示了獼猴屬種間分化的遺傳學(xué)特征,為非人靈長(cháng)類(lèi)生物醫學(xué)模型奠定了關(guān)鍵遺傳基礎。
1、填補復雜區域空白
傳統基因組組裝技術(shù)因讀長(cháng)短、錯誤率高,難以跨越復雜重復區域,導致基因組中存在大量缺口。這些缺口多位于基因組復雜結構區域(著(zhù)絲粒、SD 和 rDNA 等),而這些區域恰恰是基因組結構和功能的重要部分,涉及染色體的穩定性、基因表達調控以及染色體的重排等生物學(xué)過(guò)程。
為了解決這一難題,研究團隊首先構建了食蟹猴孤雌生殖胚胎干細胞系(MFA582-1)。孤雌生殖細胞系具有兩套染色體遺傳信息近乎純合的特性,是構建參考基因組的理想材料。在此基礎上,團隊利用自主開(kāi)發(fā)的基于特有 k-mer 標記的分型迭代替換局部組裝工具,成功解決了現有組裝軟件未能或錯誤組裝的上百個(gè)復雜結構區域,最終構建食蟹猴 T2T 基因組 T2T-MFA8v1.1。該基因組全長(cháng) 3.06 Gbp,QV 達到 71.27,NG50 為 162.13 Mbp,與人類(lèi)基因組 T2T-CHM13v2.0 的水平相當,成為首個(gè)非人靈長(cháng)類(lèi)完整參考基因組,為深入理解復雜基因組區域提供了重要工具。研究團隊發(fā)現:
● SD 分布模式的特異性:食蟹猴的 SD 總長(cháng) 122.51 Mbp,較人類(lèi)(227.36 Mbp)減少 46%,且更富集于亞端粒區(人類(lèi)偏向近著(zhù)絲粒區)。這種分布差異可能驅動(dòng)靈長(cháng)類(lèi)基因組重塑的方向性。
● rDNA 分布:食蟹猴的 rDNA 僅定位于 10 號染色體,而在人類(lèi)基因組中,rDNA 分布于 5 條近端著(zhù)絲粒染色體(chr13、chr14、chr15、chr21、chr22)。這一差異為人類(lèi)近端著(zhù)絲粒染色體的形成及人類(lèi)疾病 21-三體綜合征的演化醫學(xué)機制提供了新的解釋。
● 著(zhù)絲粒結構演化:食蟹猴著(zhù)絲粒由 SF7 家族 α-衛星主導,平均長(cháng)度較人類(lèi)長(cháng) 3.83 倍(如 chr15 達 13.88 Mbp),并保留與靈長(cháng)類(lèi)祖先共存的古老 SF8-SF13 序列層,揭示了獼猴屬存在新著(zhù)絲粒形成的獨特演化機制。
2、人類(lèi)與獼猴屬大尺度結構變異導致的基因組差異
基因組的大尺度結構變異(如倒位、易位)能夠改變染色質(zhì)三維折疊,進(jìn)而影響基因表達模式。然而,人類(lèi)與獼猴屬之間的大尺度基因組結構變異尚未得到全面解析,且這些結構變異在靈長(cháng)類(lèi)演化過(guò)程中的功能效應仍缺乏系統性的證據支持。
為解決這一問(wèn)題,研究團隊優(yōu)化了結構變異鑒定方法,共鑒定出 93 個(gè)人類(lèi)與獼猴屬之間的固定結構變異,其中包括78 個(gè)倒位、11 個(gè)著(zhù)絲粒重定位和 4 個(gè)染色體內易位,其中 21 個(gè)結構變異為首次報道(圖2)。進(jìn)一步研究發(fā)現,在靈長(cháng)類(lèi)腦演化過(guò)程中,超過(guò) 400 個(gè)基因可能因相關(guān)結構變異而發(fā)生腦細胞類(lèi)群的表達差異。以 FOLH1 基因為例,其編碼的谷氨酸羧肽酶II(GCPII)在神經(jīng)系統的谷氨酸調控中發(fā)揮關(guān)鍵作用,基因突變與智力障礙密切相關(guān)。在獼猴屬中,FOLH1 基因為單拷貝,而在人類(lèi)中,則包含 FOLH1 和 FOLH1B(與獼猴 FOLH1 直系同源)兩個(gè)拷貝。人類(lèi)的 FOLH1 基因在少突膠質(zhì)細胞中高表達,而 FOLH1B 基因在大腦不同細胞類(lèi)群中幾乎不表達,與獼猴屬 FOLH1 在多個(gè)細胞類(lèi)群中廣泛表達的模式存在顯著(zhù)差異。為了揭示這種差異的成因,研究團隊整合了單細胞多組學(xué)數據,發(fā)現在人類(lèi)與獼猴屬的演化過(guò)程中,人類(lèi) FOLH1B 調控區的一個(gè) 1.4 kbp 片段特異性地丟失,導致了其在腦內無(wú)法表達而“假基因化”。同時(shí),人類(lèi)的 FOLH1 基因由于重復事件的發(fā)生,導致了染色質(zhì)三維結構的重塑,進(jìn)而改變了其細胞類(lèi)群表達模式。這一研究為結構變異在演化過(guò)程中如何影響細胞類(lèi)型特異性表達模式提供了新的見(jiàn)解,特別是在闡明譜系特異性表型的形成及人類(lèi)疾病的發(fā)生機制解析上具有重要的科學(xué)意義。
3、食蟹猴與恒河猴間從序列到表型的種間遺傳分化
食蟹猴與恒河猴雖同屬于獼猴屬,但在形態(tài)學(xué)特征、行為模式及疾病易感性等方面均存在顯著(zhù)差異。然而,這些表型差異背后的遺傳基礎一直未得到充分闡明,從而嚴重制約了這兩個(gè)物種在生物醫學(xué)模型中的應用潛力。
研究團隊通過(guò)泛基因組圖等手段,鑒定了 240 Mbp 的物種間復雜結構差異區域,涵蓋 Mafa-AG/B、CYP2C76 及 GSTM 等基因家族。其中,恒河猴 CYP2C76(猴特異性細胞色素 P450 酶基因)呈現 4 種結構單倍型,而食蟹猴僅保留 2 種,這可能反映了兩個(gè)物種之間的代謝差異。此外,研究團隊鑒定出16.76 Mbp的食蟹猴與恒河猴遺傳分化區域(genetic differentiation regions),發(fā)現兩物種間的固定遺傳差異在調控元件中出現了 9.43 倍富集,其中包括可能影響尾巴長(cháng)度的 HOXD13 基因。這一發(fā)現與食蟹猴尾巴顯著(zhù)長(cháng)于恒河猴的表型特征相吻合。此外,該發(fā)現也與鹿鼠尾巴適應性演化的研究形成了趨同演化案例,為揭示哺乳動(dòng)物尾巴形態(tài)多樣性的遺傳機制提供了新的視角。
總體而言,該研究通過(guò)研發(fā)新型計算工具實(shí)現非人靈長(cháng)類(lèi) T2T 完整基因組組裝,系統闡明了獼猴屬與人類(lèi)在基因組結構層面的演化差異,不僅揭示了結構變異通過(guò)三維基因組重構調控和調控元件改變等影響基因表達的細胞類(lèi)型特異性,還深入解析了獼猴屬種間分化的遺傳學(xué)基礎,為獼猴生物醫學(xué)模型奠定了堅實(shí)的遺傳基礎。該研究深化了我們對靈長(cháng)類(lèi)演化醫學(xué)、生物醫學(xué)模型和譜系特異性適應的理解。
論文鏈接:
https://www.nature.com/articles/s41589-025-01849-9
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com