最近電視劇《棋士》熱播,圍棋的很多專(zhuān)業(yè)術(shù)語(yǔ)被大眾所熟知,比如“先手棋”。所謂“先手”,便是下棋時(shí)迫使對方必須回應的關(guān)鍵落子,擁有先手,往往能搶占棋局主動(dòng)權,是致勝的關(guān)鍵。在中美科技博弈的棋局里,我們也看到了這樣的一幕。
2025年4月2日,美國國立衛生研究院(NIH)發(fā)布公告,明確禁止“受關(guān)注國家”機構訪(fǎng)問(wèn) NIH “受控訪(fǎng)問(wèn)數據存儲庫及其相關(guān)數據”。在“受關(guān)注國家”中,中國(包括香港和澳門(mén))、俄羅斯等赫然在列。
這一蠻橫舉措,瞬間將中美科技領(lǐng)域的博弈再度推至風(fēng)口浪尖,在生物科研領(lǐng)域激起巨浪。一場(chǎng)圍繞數據主權與科研發(fā)展的激烈較量,拉開(kāi)帷幕。
數據封鎖:難以阻擋中國科研步伐
大家都知道,美國國家生物技術(shù)信息中心(NCBI)旗下,諸如全球最大的核酸序列數據庫(GenBank)、基因表達數據庫(GEO)、癌癥基因組圖譜(TCGA)等,在行業(yè)內被視作核心資源,是全球科研的“基礎設施”,支撐著(zhù)世界各地科研人員開(kāi)展研究工作。
相關(guān)數據庫的影響情況
如今,美國一紙禁令,直接把這些數據庫變成了中美科技博弈的“新戰場(chǎng)”。對我們國家的科研人員來(lái)說(shuō),絕非“訪(fǎng)問(wèn)受限”這么簡(jiǎn)單。眾多依賴(lài)國際數據庫開(kāi)展的科研課題,可能面臨數據斷供的風(fēng)險。
另外,這些數據庫不僅僅是存儲數據,更是全球生物信息和生命科學(xué)領(lǐng)域極為重要的學(xué)術(shù)交流平臺,也將對中國科研人員與國際同行的交流合作產(chǎn)生一定影響。
再往深了看,這場(chǎng)“數據封鎖”背后,實(shí)質(zhì)是一場(chǎng)激烈的“科學(xué)數據主權”爭奪戰。美國這么做,就是想牢牢抓住生物科技標準制定的話(huà)語(yǔ)權,在未來(lái)生物經(jīng)濟競爭中占據優(yōu)勢。
但是,以上種種均無(wú)法阻斷我國科研的步伐。這是因為,我國已建成位于北京的國家生物信息中心(NGDC)和位于深圳的國家基因庫(CNGB)。從基礎數據存儲到前沿科研應用,二者一南一北,相輔相成,為我國生物信息數據的交匯與共享,鑄就了堅實(shí)的根基。
未雨綢繆:一場(chǎng)長(cháng)達十年的精心“布局”
早在2011年,當大多數人還未意識到數據主權的重要性時(shí),國家四部委就高瞻遠矚,聯(lián)合批復建設深圳國家基因庫(CNGB)。這一極具前瞻性的決策,堪稱(chēng)我國在生物科技領(lǐng)域落下的一步“先手棋”,為生物科技的長(cháng)遠發(fā)展打下基礎。
如今,深圳國家基因庫通過(guò)建立自主可控的數據資源共享平臺,已支撐全球 642 個(gè)單位機構超過(guò) 17PB 數據的開(kāi)放共享需求,覆蓋 202 個(gè)國家和地區。深圳國家基因庫可存儲不同生物的基因樣本超過(guò) 1000 萬(wàn)份,其基因樣品保存規模、存儲量和可訪(fǎng)問(wèn)數據量均為全球第一,支撐全球 600 多家單位數據匯交和共享。
在國際標準認證方面,深圳國家基因庫是國內首個(gè)榮獲 CoreTrustSeal 認證的數據庫,并且成功躋身世界數據系統(WDS)核心成員之列。這一成就不僅標志著(zhù) CNGB 在數據管理和質(zhì)量保障方面達到了國際頂尖水平,更意味著(zhù)中國在生物數據領(lǐng)域開(kāi)始與國際先進(jìn)水平并駕齊驅。
在技術(shù)層面,深圳國家基因庫獨創(chuàng )了“兩庫一平臺”架構,即生物樣本庫、生物信息庫、數字化平臺。這一創(chuàng )新架構實(shí)現了從樣本采集到數據分析的全鏈條國產(chǎn)化,徹底擺脫了對國外技術(shù)的依賴(lài),讓中國在生物數據處理的各個(gè)環(huán)節都擁有了自主可控的核心技術(shù)。
攜手努力:打造“不斷供”科研生態(tài)
在中美“數據脫鉤”的大背景下,美國數據封鎖的陰云密布,給全球科研合作與交流帶來(lái)了諸多阻礙。但令人欣慰的是,深圳國家基因庫憑借在“數據資源自主性”與“科研成果發(fā)表”方面的探索,正努力成為全球科研的“新支點(diǎn)”。
在數據資源自主性上,深圳國家基因庫積極構建“不斷供”的科研“底座”,定期同步 NCBI、EBI 等國際數據庫的公開(kāi)數據,“備份”關(guān)鍵科研資源。在數據維度上,將文獻數據、樣本數據、基因數據、變異數據等多種數據打通,開(kāi)放使用,互聯(lián)互通。在檢索方面,CNGB 支持常規關(guān)鍵詞搜索與 30 余個(gè)專(zhuān)有科學(xué)數據庫(如植物、動(dòng)物、微生物、疾病等)定向查詢(xún),提升數據獲取效率。
在科研成果發(fā)表方面,深圳國家基因庫已打造出國際認可的科研成果全鏈條支撐體系,通過(guò) FAIRsharing 認證及 re3data 收錄,支持 Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science 等多個(gè)國際著(zhù)名出版社/系列期刊投稿發(fā)文,已助力 1902 篇論文在 Science、The Lancet 等頂級期刊發(fā)表。同時(shí),為數據賦予唯一 DOI 標識,保障中國科研人員成果在全球的可追溯性與學(xué)術(shù)話(huà)語(yǔ)權。
盡管目前在數據體量和部分尖端技術(shù)上,CNGB 與美國數據庫仍存在一定差距,短期內難以實(shí)現完全替代,但這些自主可控的數據資源,已然為國內科研筑牢根基,讓我國科研在數據層面擁有了更多底氣。只要科研界攜手并肩,讓我們的數據庫充分發(fā)揮效能,替代美國數據庫、引領(lǐng)全球科研發(fā)展的那一天,一定會(huì )到來(lái)。
數據自主:重構全球科研秩序
此次禁令不僅僅是一次技術(shù)封鎖,更是全球科研秩序重構的信號。作為粵港澳大灣區生物數據要素流通樞紐的核心引擎,深圳國家基因庫(CNGB)正以開(kāi)放之姿,投身全球合作。
其發(fā)起的地球生物基因組計劃(EBP)、百萬(wàn)微生態(tài)計劃(MMHP)、萬(wàn)種鳥(niǎo)基因組計劃(B10K)、萬(wàn)種植物基因組計劃(10 KP )等國際大科學(xué)計劃,吸引全球科研力量聚焦生物多樣性研究,不同國家科研團隊共享數據、協(xié)同攻關(guān),推動(dòng)基礎生物學(xué)認知飛躍。時(shí)空組學(xué)聯(lián)盟(STOC)等前沿科學(xué)組織的成立,更是將各國頂尖科研人才匯聚一堂,引領(lǐng)生命科學(xué)前沿探索。
不僅如此,CNGB 還聯(lián)動(dòng)拉脫維亞經(jīng)濟部、老撾科技部、阿聯(lián)酋國際鹽堿植物研究所等多元機構,牽頭發(fā)起“一帶一路”生命科技促進(jìn)聯(lián)盟倡議,毫無(wú)保留地輸出標準化樣本庫和數據庫技術(shù)體系,搭建起跨國科研合作橋梁,帶動(dòng)沿線(xiàn)國家生物科技產(chǎn)業(yè)協(xié)同發(fā)展,為 “一帶一路” 生物經(jīng)濟注入澎湃新動(dòng)力,彰顯中國在全球生命科學(xué)領(lǐng)域的擔當。
依托自主可控的數據庫生態(tài),深圳國家基因庫不但為國內科研應急兜底,抵御外部封鎖,還將為全球科研機構貢獻“開(kāi)放共享、安全可信”的中國方案,重塑全球科學(xué)數據合作的“中國范式”。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com