基因測序儀是生命科學(xué)研究和產(chǎn)業(yè)發(fā)展的重要工具。它能夠讀取和分析基因信息,為基因檢測、基因編輯、基因合成等應用提供底層支撐,被稱(chēng)為生命科學(xué)領(lǐng)域“光刻機”。近期,由于國際基因測序巨頭因美納(Illumina, Inc.)被商務(wù)部列入“不可靠實(shí)體清單”,一時(shí)引發(fā)“行業(yè)地震”,國產(chǎn)測序平臺有關(guān)的議題也被推到風(fēng)口浪尖。
國內相關(guān)科研機構和行業(yè)中下游企業(yè)用戶(hù)也面臨一個(gè)亟待解決的問(wèn)題:誰(shuí)能夠真正“替代”因美納?滴水穿石,非一日之工?;驕y序儀因其極度復雜、極度集成的結構,從生產(chǎn)出一臺“能用”的測序儀到生產(chǎn)出多臺穩定“好用”的測序儀,并不是一蹴而就的過(guò)程。個(gè)中種種,尚需時(shí)間以及用戶(hù)的反復驗證。
然而,更換測序平臺極有可能對研究工作以及檢測工作產(chǎn)生較大影響,因而平臺的選擇需要綜合考量,比對因美納的成立時(shí)間、全線(xiàn)產(chǎn)品線(xiàn)布局以及市場(chǎng)占有率等多種因素,當前國內雖有數十家企業(yè)投身基因測序技術(shù)研發(fā)與設備生產(chǎn)賽道。但從目前來(lái)看,總部位于深圳鹽田的華大智造作為國內龍頭,無(wú)論從測序平臺的全面性及穩定性、客戶(hù)群體數量(超過(guò) 3000 家)、平臺支撐的文章數(超過(guò) 10000 篇)、全流程解決方案等多種角度來(lái)看,都無(wú)疑是最 具競爭力的公司。
另外,據華大智造官網(wǎng)介紹公司是“全球唯一同時(shí)擁有‘激發(fā)光’、‘自發(fā)光’和‘不發(fā)光’三大測序技術(shù)路線(xiàn)的企業(yè)”。筆者亦留意到華大智造近期動(dòng)作頻頻,在剛剛落幕的 AGBT(基因組生物學(xué)技術(shù)進(jìn)展大會(huì ))上,華大智造又推出了名為 DNBSEQ-T1+ 的測序儀,24 小時(shí)可完成 Tb 級測序,一次可運行一個(gè)人的 WGS、WGBS、RNA+meta 及腫瘤 ctDNA 多組學(xué)檢測。另外,全面擁抱 AI 算法,推出 E25 Flash 生成式 AI 閃速測序儀,最快 2 小時(shí)完成 SE50 測序。也側面能夠看到華大智造在激烈競爭格局下,在測序布局上不斷審視客戶(hù)需求、審視產(chǎn)品布局的應對。
本文羅列了部分對因美納測序平臺與華大智造測序平臺綜合性能進(jìn)行比對的文章數據,涵蓋測序的基礎性能、宏基因組測序、古基因組測序、甲基化測序等方向,在這個(gè)時(shí)間節點(diǎn),希望能夠給各位讀者提供參考。
基礎性能評價(jià)
由生物分子資源設施協(xié)會(huì )(Association of Biomolecular Resource Facilities,ARBF)主導的 ABRF NGS II 期研究成果發(fā)表于 Nature Biotechnology(圖1A)(Foox et al., 2021)。研究團隊基于多個(gè)商業(yè)化公司的多款測序平臺,在多個(gè)實(shí)驗室對同一人類(lèi)基因組家族、三個(gè)單獨菌株和十種細菌的宏基因組混合物進(jìn)行測序,并將各平臺數據進(jìn)行全方位、系統性比較,分析各個(gè)測序平臺的性能差異和測序質(zhì)量,以提供真實(shí)全面的參考證據。該研究發(fā)現在高通量測序儀中,華大智造的多款 DNBSEQ 測序平臺(MGISEQ-2000等)提供了最低的測序錯誤率(圖1B)(Jeon et al., 2021)。
而來(lái)自韓國大田的個(gè)性化基因組醫學(xué)研究中心(KRIBB)的研究團隊則綜合性地比較了華大智造的多款 DNBSEQ 測序平臺(MGISEQ-2000/DNBSEQ-T7)與因美納的 NovaSeq 6000 平臺在全基因組測序層面的性能,相關(guān)研究成果發(fā)表于 Genes & Genomics(圖1C)(Jeon et al., 2021)。
該研究利用此三平臺對來(lái)自韓國肺癌患者的正常和腫瘤組織進(jìn)行測序,并對產(chǎn)生的數據做了平行比較后發(fā)現各測序平臺在全基因組測序(WGS)中的片段大小分布、基因覆蓋率和表達變異檢測方面的表現都很相似(圖1D,1E),表明了 MGISEQ-2000 和 DNBSEQ-T7 平臺的性能表現已經(jīng)達到了國際領(lǐng)先水平 (Jeon et al., 2021)。
圖1A. 生物分子資源設施協(xié)會(huì )ARBF所開(kāi)展研究的發(fā)文封面;
圖1B. 基于包含DNBSEQ測序平臺在內的多款測序儀的測序數據性能表現;
圖1C. 韓國某科研團隊開(kāi)展肺癌研究的發(fā)文封面;
圖1D,1E. 多款測序平臺的原始測序數據質(zhì)量的比較。
由于篇幅因素,在此兩項較為詳細介紹的案例之外,仍有多項研究表明:華大智造的 DNBSEQ 測序平臺在測序質(zhì)量、覆蓋均勻性、GC 覆蓋率百分比和變異準確度等方面與因美納測序平臺無(wú)明顯區別,且可以以更低的成本用于廣泛的基因組學(xué)研究領(lǐng)域(Chen et al., 2019; Jeon et al., 2023; Kim et al., 2021)。
宏基因組測序
宏基因組高通量測序技術(shù)(mNGS)憑借其顯著(zhù)優(yōu)勢,在傳染性病原體檢測領(lǐng)域的應用日益廣泛,正快速從實(shí)驗室理論研究階段邁向臨床實(shí)驗室實(shí)際應用。
來(lái)自天津醫科大學(xué)總醫院呼吸與危重癥醫學(xué)科的研究團隊基于不同高通量測序平臺開(kāi)展肺部傳染病的診斷工作,相關(guān)成果發(fā)表于 Frontiers in Pharmacology (圖2A)(Han et al., 2023)。該前瞻性研究系統性比較了華大智造 DNBSEQ 測序需平臺與因美納測序平臺在檢測肺部病原體方面的表現 (Han et al., 2023)。研究結果表明這兩種測序的診斷靈敏度均明顯高于常規檢查(分別為82.1% vs. 38.5%,p < 0.001;76.9% vs. 38.5%,p < 0.001)(圖2B) (Han et al., 2023)。兩平臺的靈敏度和特異性無(wú)明顯差異,且病原體檢出率也無(wú)明顯差異,診斷性能相似,均優(yōu)于常規檢查 (Han et al., 2023)。
而來(lái)自中國人民解放軍疾病預防控制中心研究團隊則將將宏基因組測序應用于鸚鵡熱衣原體的人類(lèi)致命感染診斷中,相關(guān)成果發(fā)表于 BMC Genomics(圖2C)(Wang et al., 2021)。該研究同樣使用了華大智造 DNBSEQ 測序平臺與因美納測序平臺,發(fā)現兩平臺均可快速識別未知感染(圖2D)并提供關(guān)于抗生素敏感性的信息,但 DNBSEQ 測序平臺可產(chǎn)生更多數據,從而提高測序深度和提供更多抗生素敏感性信息 (Wang et al., 2021)。
在宏基因組的組裝上,目前主流方法是第二代短讀測序,但第三代長(cháng)讀技術(shù)的進(jìn)步提供了克服短讀測序局限性的機會(huì )。多篇系統性研究表明混合組裝是一種整合短讀和長(cháng)讀優(yōu)勢的策略,而短讀長(cháng)數據來(lái)源于華大智造 DNBSEQ 測序平臺或因美納測序平臺并不會(huì )產(chǎn)生顯著(zhù)差異 (Meslier et al., 2022; Zhang et al., 2023)。
最近,中國疾病預防控制中心性病艾滋病預防控制中心病毒免疫室使用華大智造 MGISEQ-2000 高通量測序儀和華大序風(fēng) CycloneSEQ-WT02 納米孔測序儀,對HIV病毒近全長(cháng)擴增子進(jìn)行了測序分析,鑒定出新的 HIV-1CRF 分枝 CRF172 0755,并提供了該重組型的詳細信息(圖2E,2F)(Li et al., 2024)。
圖2A.肺部傳染病診斷研究的文章信息;
圖2B.基于兩種測序平臺的宏基因組測序診斷結果與常規檢查結果對比;
圖2C.鸚鵡熱診斷研究的文章信息;
圖2D.基于DNBSEQ測序平臺對鸚鵡熱感染患者樣本開(kāi)展mNGS研究檢測到的前十大物種;
圖2E. 基于DNBSEQ和CycloneSEQ測序平臺開(kāi)展HIV全長(cháng)測序文章信息;
圖2F. HIV-1CRF分枝CRF172 0755近全長(cháng)基因組示意圖。
古基因組測序
隨著(zhù)測序成本的下降和準確度的提高,高通量測序技術(shù)在古基因組研究中的應用愈發(fā)普及。目前,該技術(shù)已被廣泛用于構建古人、類(lèi)人動(dòng)物、其他動(dòng)植物以及真菌的基因組。與此同時(shí),群體基因組和宏基因組研究也在古基因組領(lǐng)域興起,部分研究更是拓展至轉錄組和表觀(guān)遺傳領(lǐng)域。
由于長(cháng)時(shí)間的水解、氧化及環(huán)境微生物降解作用,古 DNA 經(jīng)常處于嚴重降解狀態(tài),且往往存在于復雜的富含外源 DNA 污染的環(huán)境中,給研究帶來(lái)了巨大挑戰。
華大基因聯(lián)合丹麥哥本哈根大學(xué)、丹麥技術(shù)大學(xué)等組成的研究團隊綜合性比較了華大智造 DNBSEQ 測序平臺和因美納測序平臺在古基因組研究中的性能表現,相關(guān)成果發(fā)表于 GIGA Science(圖3A)(Mak et al., 2017)。在這項研究中,研究人員分別使用華大智造 DNBSEQ 和因美納 HiSeq 2500 平臺,對 91-14000 年前的 8 個(gè)古老大型犬科動(dòng)物的 DNA 樣本進(jìn)行測序并對測序性能和數據質(zhì)量進(jìn)行比較 (Mak et al., 2017)。研究結果表明,兩個(gè)測序平臺的數據表現基本相當(圖3B),DNBSEQ 測序平臺在古基因組測序領(lǐng)域極具潛力,是一種行之有效且價(jià)值頗高的潛在替代平臺,值得利用它對降解 DNA 展開(kāi)進(jìn)一步探索 (Mak et al., 2017)。
另一項研究中,復旦大學(xué)的研究團隊聯(lián)合廈門(mén)大學(xué)的研究團隊首次使用了公元前 1750 年到公元 60 年左右的四個(gè)古代中國人骨骼樣本,系統性比較了華大智造 MGISEQ-2000 和 Illumina X-Ten 平臺在古代人類(lèi) DNA 測序中的性能,相關(guān)成果發(fā)表于 Frontiers in Genetics(圖3C)(Zhu et al., 2021)。研究成果表明,MGISEQ-2000 和 X-Ten 具有相當的性能,均可以作為古基因組學(xué)研究的潛在選擇測序平臺(圖3D)(Zhu et al., 2021)。
圖3A.評估DNBNSEQ測序平臺在考古研究中的性能的文章信息;
圖3B.考古樣本利用兩種測序平臺所獲數據總結;
圖3C.文少卿團隊相關(guān)研究的文章信息;
圖3D.MGISEQ-2000與X-Ten在100kb閱讀框中測序覆蓋率。
甲基化測序
高通量測序技術(shù)憑借輸出量高、準確度高的優(yōu)勢,已被大規模用于識別與惡性腫瘤相關(guān)的異常 DNA 甲基化,在輔助診斷、預后預測和病情監測等臨床應用方面發(fā)揮重要作用。
來(lái)自鹍遠生物的研究團隊對比了華大智造 MGISEQ-2000 測序平臺和因美納 NovaSeq 6000 測序平臺用于亞硫酸氫鹽靶向測序的性能,相關(guān)研究成果發(fā)表于 Clinical Epigenetics(圖4A)(Sun et al., 2023)。結果表明,MGISEQ-2000 展現出與 NovaSeq6000 相似的測序質(zhì)量、一致的甲基化水平、相當的癌癥信號檢測能力和準確的臨床診斷結果,說(shuō)明 MGISEQ-2000 可應用于臨床檢測 DNA 甲基化變化,特別是 cfDNA 甲基化檢測(圖4B)(Sun et al., 2023)。
圖4A.評估DNBNSEQ測序平臺在靶向甲基化測序中的性能的文章信息;
圖4B. 跨平臺甲基化測序對PDAC患者的預測分數。
總結
整體來(lái)看,來(lái)自全球各地的多個(gè)研究團隊,基于不同的應用場(chǎng)景發(fā)表的高水平同行評審研究論文表明:華大智造 DNBSEQ 測序平臺在 10 年的迭代升級中,經(jīng)過(guò)反復驗證,其 DNBSEQ 測序平臺性能與因美納測序平臺具備可比性,在部分指標有所領(lǐng)先。
論文也集中提及了一個(gè)觀(guān)點(diǎn),華大智造錯誤率更低的原因,是由于華大智造 DNBSEQ 測序技術(shù)測序原理的優(yōu)勢——即具有高準確性,低重復序列率以及低標簽跳躍等重要特性。另外,“長(cháng)讀長(cháng)+短讀長(cháng)”平臺結合也是華大智造現有測序平臺的差異優(yōu)勢點(diǎn)。
參考文獻:
Chen, J., Li, X., Zhong, H., Meng, Y., and Du, H. (2019). Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers. Scientific Reports 9.
Foox, J., Tighe, S.W., Nicolet, C.M., Zook, J.M., Byrska-Bishop, M., Clarke, W.E., Khayat, M.M., Mahmoud, M., Laaguiby, P.K., Herbert, Z.T., et al. (2021). Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study. Nature Biotechnology 39, 1129-1140.
Han, S., Zhao, Z., Yang, L., Huang, J., Wang, Y., and Feng, J. (2023). The performance of metagenomic next-generation sequencing in diagnosing pulmonary infectious diseases using authentic clinical specimens: The Illumina platform versus the Beijing Genomics Institute platform. Frontiers in Pharmacology 14.
Jeon, M.-S., Jeong, D.M., Doh, H., Kang, H.A., Jung, H., and Eyun, S.-i. (2023). A practical comparison of the next-generation sequencing platform and assemblers using yeast genome. Life Science Alliance 6.
Jeon, S.A., Park, J.L., Park, S.-J., Kim, J.H., Goh, S.-H., Han, J.-Y., and Kim, S.-Y. (2021). Comparison between MGI and Illumina sequencing platforms for whole genome sequencing. Genes & Genomics 43, 713-724.
Kim, H.-M., Jeon, S., Chung, O., Jun, J.H., Kim, H.-S., Blazyte, A., Lee, H.-Y., Yu, Y., Cho, Y.S., Bolser, D.M., et al. (2021). Comparative analysis of 7 short-read sequencing platforms using the Korean Reference Genome: MGI and Illumina sequencing benchmark for whole-genome sequencing. GigaScience 10.
Li, H., Feng, Y., Xu, Y., Li, T., Li, Q., Lin, W., Ni, W., Yang, J., Mao, W., Wang, Z., et al. (2024). Characterization of a novel HIV-1 second-generation circulating recombinant form (CRF172_0755) among men who have sex with men in China. Journal of Infection 89.
Mak, S.S.T., Gopalakrishnan, S., Carøe, C., Geng, C., Liu, S., Sinding, M.-H.S., Kuderna, L.F.K., Zhang, W., Fu, S., Vieira, F.G., et al. (2017). Comparative performance of the BGISEQ-500 vs Illumina HiSeq2500 sequencing platforms for palaeogenomic sequencing. GigaScience 6.
Meslier, V., Quinquis, B., Da Silva, K., Plaza Oñate, F., Pons, N., Roume, H., Podar, M., and Almeida, M. (2022). Benchmarking second and third-generation sequencing platforms for microbial metagenomics. Scientific Data 9.
Sun, J., Su, M., Ma, J., Xu, M., Ma, C., Li, W., Liu, R., He, Q., and Su, Z. (2023). Cross-platform comparisons for targeted bisulfite sequencing of MGISEQ-2000 and NovaSeq6000. Clinical Epigenetics 15.
Wang, K., Liu, X., Liu, H., Li, P., Lin, Y., Yin, D., Yang, L., Li, J., Li, S., Jia, L., et al. (2021). Metagenomic diagnosis of severe psittacosis using multiple sequencing platforms. BMC Genomics 22.
Zhang, Z., Yang, C., Veldsman, W.P., Fang, X., and Zhang, L. (2023). Benchmarking genome assembly methods on metagenomic sequencing data. Briefings in Bioinformatics 24.
Zhu, K., Du, P., Xiong, J., Ren, X., Sun, C., Tao, Y., Ding, Y., Xu, Y., Meng, H., Wang, C.-C., et al. (2021). Comparative Performance of the MGISEQ-2000 and Illumina X-Ten Sequencing Platforms for Paleogenomics. Frontiers in Genetics 12.
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com