傳統診斷技術(shù)依賴(lài)于患者病史、體格檢查和實(shí)驗室檢查,通常需要多次檢查才能診斷出一些復雜疾病。
近年來(lái),人工智能(AI)的發(fā)展日新月異,并在通用領(lǐng)域、生命科學(xué)和醫學(xué)等得到了廣泛應用。通過(guò)大數據集訓練出來(lái)的 AI 算法模型,其龐大的數據庫和越來(lái)越精準的識別能力,使得“AI+醫療”成為現實(shí)。
2025 年 2 月 21 日,斯坦福大學(xué)的研究人員在國際頂尖學(xué)術(shù)期刊 Science 上發(fā)表了題為:Disease diagnostics using machine learning of B cell and T cell receptor sequences 的研究論文。
該研究開(kāi)發(fā)了一種人工智能(AI)診斷工具——Machine Learning for Immunological Diagnosis(Mal-ID)。該 AI 工具可以通過(guò)篩選血液樣本中的免疫細胞(B 細胞和 T 細胞)基因序列,一次性診斷一系列感染和健康狀況。
通過(guò)一項對近 600 名參與者的研究,該 AI 工具確定了參與者是否健康或患有 COVID-19、1 型糖尿病、艾滋病或自身免疫病,以及他們最近是否接種了流感疫苗。
免疫系統通過(guò)兩種主要的免疫細胞類(lèi)型——B 細胞和 T 細胞,保存著(zhù)對過(guò)去和現在所接觸的病原體的免疫記憶。其中,B 細胞產(chǎn)生附著(zhù)在病毒和有害分子上的抗體,而 T 細胞則激活其他免疫反應或直接殺死被感染的細胞。
值得注意的是,當一個(gè)人受到感染或自身免疫性疾病時(shí),免疫系統會(huì )被激活,B 細胞和 T 細胞的數量也會(huì )增加,并開(kāi)始產(chǎn)生特定的表面受體。因此,通過(guò)對編碼這些受體的基因進(jìn)行測序,就可以解鎖這個(gè)人關(guān)于疾病和感染的獨特記錄。
在這項最新研究中,研究團隊基于人工智能(AI)構建了一種分子診斷工具,其針對 B 細胞受體(BCR)和 T 細胞受體(TCR)各訓練了三個(gè)模型——受體庫組成分析模型、CDR3 序列聚類(lèi)模型、蛋白質(zhì)語(yǔ)言模型嵌入模型,以分析編碼 B 細胞受體和 T 細胞受體關(guān)鍵區域的基因序列,并挑選出與特定疾病相關(guān)的模式。
Mal-ID的框架構建
研究團隊使用該工具在 593 人的血液樣本中篩選了 1620 萬(wàn)個(gè) B 細胞受體序列和 2350 萬(wàn)個(gè) T 細胞受體序列。這一 AI 診斷工具從這些參與者中檢測到 63 人曾患COVID-19,95 人 HIV 陽(yáng)性,86 人患系統性紅斑狼瘡,92 人患 1 型糖尿病,37 人最近接種過(guò)流感疫苗,剩余 220 名參與者為健康對照者。
在對 542 名同時(shí)擁有 B 細胞和 T 細胞數據的參與者的樣本進(jìn)行的分析中,該 AI 診斷工具在一個(gè)指標中得分高達 0.986(滿(mǎn)分為 1 分),該指標衡量的是它將參與者與他們的疾病正確匹配的程度。
Mal-ID使用IgH和TRB序列對疾病進(jìn)行分類(lèi)
此外,當比較 AI 工具單獨使用 B 細胞受體、單獨使用 T 細胞受體或同時(shí)使用這兩種受體對疾病的區分能力時(shí),研究團隊發(fā)現,將兩種細胞類(lèi)型的數據結合起來(lái)效果最好。例如,1 型糖尿病和系統性紅斑狼瘡在 T 細胞受體中有更清晰的標記,而 COVID-19、HIV 和流感在 B 細胞受體中較易識別。
Mal-ID可以區分已知的SARS-CoV-2特異性抗體序列和健康供體序列
研究團隊表示,AI 工具可以調整到只篩查一種或多種疾病,但它的預測并不是完全沒(méi)有錯誤的,距離臨床應用還有很長(cháng)的路要走。事實(shí)上,從另一種角度來(lái)說(shuō),AI 作為基于大數據的預測模型,其錯誤預測也可能源于傳統檢測方法所遺漏的人群之間的細微差異。因此,這些 AI 的錯誤案例可能有助于梳理出免疫相關(guān)疾病的全新子類(lèi)別,并有助于定制個(gè)性化治療方案。
研究模式圖:從血液到疾病的免疫受體測序分類(lèi)
總的來(lái)說(shuō),這項發(fā)表于 Science 的研究開(kāi)發(fā)了一款 AI 診斷工具——Mal-ID,該 AI 工具可以自動(dòng)識別免疫受體測序數據以區分一系列疾病狀態(tài),包括 COVID-19、糖尿病、艾滋以及自身免疫疾病等。隨著(zhù)進(jìn)一步的驗證和擴展,Mal-ID 有望開(kāi)發(fā)出利用免疫受體群體中包含的大量信息進(jìn)行醫學(xué)診斷的臨床工具,還可能用于預測診斷疾病的具體進(jìn)程。
免疫細胞(第一圖)通過(guò)重組DNA片段(第二圖)產(chǎn)生高度可變的受體,以識別細菌、病毒等威脅(第三圖),識別這些受體(第四圖)可以幫助診斷復雜疾病
論文鏈接:
https://www.science.org/doi/10.1126/science.adp2407
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com