2020年底,DeepMind旗下人工智能(AI)系統AlphaFold在蛋白質(zhì)分子結構預測領(lǐng)域取得了史 無(wú)前 例的進(jìn)步。這不僅有力推動(dòng)了生命科學(xué)領(lǐng)域的發(fā)展,也愈發(fā)印證了具備掌握 "暗知識" 能力的AI能夠助力人們直接跳過(guò)在 "未知" 暗箱中摸索的過(guò)程,而直接抵達 "新知" 的彼岸。
因此,也就不難理解近年來(lái)日漸成熟且炙手可熱的人工智能輔助藥物發(fā)現 (以下稱(chēng)AIDD: AI Drug Design) 為何在短短數年間就從萌芽發(fā)展到幾乎參與從藥物靶點(diǎn)發(fā)現到臨床試驗等藥物研發(fā)的全流程。尤其面對新藥研發(fā)中的靶點(diǎn)篩選、化合物發(fā)現等存在人類(lèi)認知盲區的環(huán)節,AIDD正在顯著(zhù)降低對專(zhuān)家知識和海量數據的苛求,并有望改變新藥研發(fā) "九死一生" 的困局。
除了AI技術(shù)自身進(jìn)步之外,AIDD的快速普及也離不開(kāi)"生逢其時(shí)"——成熟的云計算技術(shù)也恰到其處為AIDD提供必需的數字化基礎設施和能力,讓藥企得以迅速突破存儲、算力、機器學(xué)習模型等數字化瓶頸,使AIDD得以成為高效的常態(tài)化工具。例如,在新冠疫 苗研發(fā)中,莫德納(Moderna)通過(guò)在亞馬遜云科技平臺構建的機器學(xué)習能力,2 天內就完成了 mRNA COVID-19 疫 苗的序列,25天就發(fā)布了第一個(gè)臨床批次。由此預示著(zhù)藥物研發(fā)正全面步入 "AI時(shí)代" 。
AIDD帶來(lái)藥物研發(fā)大提速
新藥研發(fā)一直是人類(lèi)科研領(lǐng)域中極具風(fēng)險和復雜度、且耗時(shí)最漫長(cháng)的技術(shù)研究領(lǐng)域之一。根據《自然》(Nature)雜志的數據顯示,一款新藥的整體成本大約是26億美元,耗時(shí)約10年,成功率卻不到十分之一。
自20世紀90年代中期,計算機輔助藥物研發(fā)(CADD: Computer Aided Drug Design)開(kāi)始被使用并逐漸成為藥企的主流數字化輔助技術(shù)。但CADD的能力局限于對已有的知識和數據的篩選與優(yōu)化,其作用更多是對人力的 "替代" 而非 "突破" ,因此無(wú)法觸達人類(lèi)尚未涉足的認知盲區。
相較之下,AIDD能夠充分探索未知的分子結構空間,生成現有經(jīng)驗與數據之外的全新分子化合物結構,給藥物研發(fā)帶來(lái)了真正的顛覆性變革。通過(guò)將AI所擁有的機器學(xué)習、深度學(xué)習、圖像識別、認知計算等能力嵌入藥物研發(fā)各環(huán)節,可預測識別更為準確的疾病靶點(diǎn),并基于濕實(shí)驗及CADD模擬數據進(jìn)行新藥分子設計、化合物活性評價(jià)、毒 性評價(jià)等研發(fā)過(guò)程,大幅降低了對數據量和專(zhuān)家知識的依賴(lài)。
AIDD最直觀(guān)的價(jià)值還在于顯著(zhù)減少傳統藥物研發(fā)的高昂資金和時(shí)間成本,給研發(fā)效率帶來(lái)巨大飛躍。據Exscientia Company Deck數據顯示,使用AI技術(shù)可以減少約35%的新藥研發(fā)成本,研發(fā)周期也縮短到了1-2年。
云計算推進(jìn)AIDD成為常態(tài)化工具
2021年,亞馬遜云科技客戶(hù)、AI藥物研發(fā)公司英矽智能宣布了全球第一款由AI發(fā)現并設計的用于特發(fā)性肺纖維化治療的候選藥物已進(jìn)入臨床試驗階段。從靶點(diǎn)發(fā)現到化合物驗證,英矽智能用時(shí)不到18個(gè)月,花費僅260萬(wàn)美元,降低了約99%的新藥研發(fā)計算成本。
英矽智能的藥物發(fā)現引擎建立在亞馬遜云科技平臺之上,是公司產(chǎn)品組合的核心。該引擎使用數百萬(wàn)個(gè)數據樣本和多種數據類(lèi)型來(lái)發(fā)現疾病生物標志物,確定最有希望的靶點(diǎn),并設計具有特定屬性的小分子化合物。
由于英矽智能的人工智能平臺要處理大量的實(shí)驗和文本數據,所以對于圖形處理器 (GPU) 的要求很高。英矽智能的AI工具如PandaOmics™和Chemistry42™都運行于A(yíng)mazon Elastic Compute Cloud(Amazon EC2 ),以獲得具有極具靈活性和可擴展性的云端服務(wù)器而無(wú)需維護龐大的本地計算集群。另外,英矽智能還使用了對象存儲服務(wù)Amazon Simple Storage Service (Amazon S3) 存儲相關(guān)數據,使其分布于6個(gè)國家的團隊能夠輕松訪(fǎng)問(wèn)所需數據并進(jìn)行跨國合作。
成熟、易用且 "AI友好" 的云平臺為各行業(yè)創(chuàng )造了邁入AI時(shí)代的 "捷徑" 。到目前為止,云上超過(guò)75%的人工智能應用都基于亞馬遜云科技平臺開(kāi)發(fā),也使亞馬遜云科技積累了豐富的人工智能和機器學(xué)習技術(shù)和成功經(jīng)驗。對于A(yíng)IDD所必需的算力、算法、數據三大數字化基礎及安全合規要求,亞馬遜云科技都能提供完善的服務(wù)與技術(shù)支撐:
● 無(wú)需初期基礎架構投入,即可獲得AIDD所需的高性能GPU/ CPU算力,且按需付費;
● 提供大量的訓練推理和部署工具,支持多種深度學(xué)習框架。機構和人員無(wú)需深入了解相關(guān)知識即可以快速展開(kāi)研發(fā)和試驗;
● 亞馬遜云科技Marketplace提供數百種算法和模型。亞馬遜公開(kāi)數據集中也提供多種藥物研發(fā)所需的科學(xué)數據,如ChEMBL,ZINC與Open Target等。
● 亞馬遜云科技的云基礎設施通過(guò)全球98項安全合規認證,并遵循和支持超過(guò)全球50種生命科學(xué)合規規范,包括GxP、HIPAA,、HITRUST,以及獲得《中國人類(lèi)遺傳資源管理條例》中方單位認證,使團隊、機構之間可進(jìn)行安全無(wú)憂(yōu)的數據合作。
據不完全統計,全球已經(jīng)有近40款以上利用AI涉及的藥物管線(xiàn)已經(jīng)步入了臨床階段。隨著(zhù)AIDD得到廣泛應用,已有國內外的眾多企業(yè)選擇亞馬遜云科技作為部署AIDD的云計算平臺。而亞馬遜云科技不僅能提供AIDD所需的云上基礎設施,還可直接助力AI工具的開(kāi)發(fā)和使用,或者使用亞馬遜云科技多達92種生命科學(xué)公開(kāi)數據集快速進(jìn)入模型訓練。
近年來(lái),基于亞馬遜云科技,阿斯利康開(kāi)發(fā)了由機器學(xué)習驅動(dòng)的病理圖像識別檢測模型,用于替代以往在候選藥物研發(fā)時(shí)以人工進(jìn)行樣本編目的方式。借助Amazon SageMaker Ground Truth,阿斯利康能夠快速注釋、收集和分類(lèi)訓練樣本,并形成可用于模型訓練的數據集,而所用的時(shí)間僅為之前的50%。
除了節省時(shí)間和人力成本,使用數據集訓練的模型還幫助研發(fā)人員獲得更準確的分析結果。在雙方開(kāi)展的試點(diǎn)中,阿斯利康使用2000個(gè)樣本來(lái)分析造成糖尿病損傷的關(guān)鍵結構,準確率達到95%,使科學(xué)家能夠快了解藥物的安全性和有效性,加速了新藥研發(fā)和上市的進(jìn)程。
釋放AIDD更大潛力使藥物研發(fā)全面步入"AI時(shí)代"
"開(kāi)放"是AI技術(shù)得以發(fā)展與應用的關(guān)鍵要素。要使AIDD在未來(lái)得到更充分的開(kāi)發(fā)與探索,勢必要讓其走出僅賦能單個(gè)企業(yè)的孤島。著(zhù)眼未來(lái),借助公有云對數據安全的保護及合規分享機制,制藥企業(yè)之間將有機會(huì )在確保核心數據安全的前提下,實(shí)現跨企業(yè)的數據合作,以更開(kāi)放的生態(tài)不斷提升AIDD的能力、應用范圍和影響力。
早在2019年,亞馬遜云科技就與全球十大制藥公司共同構建了用于藥物發(fā)現的聯(lián)邦學(xué)習平臺(Federated machine learning for drug discovery on Amazon Web Services) MELLODDY,讓藥企在安全、合規、確保數據隱私的環(huán)境下,進(jìn)行多方合作,加速整個(gè)行業(yè)的科研發(fā)現進(jìn)程。當前,MELLODDY 平臺以前所未有的規模運行在亞馬遜云科技平臺上,在數十億個(gè)實(shí)驗數據點(diǎn)上采用聯(lián)邦學(xué)習方式訓練模型,分析了超過(guò) 2000 萬(wàn)個(gè)化學(xué)分子結構及理化性質(zhì)。而且MELLODDY在企業(yè)無(wú)需共享專(zhuān)有數據和模型的基礎上即可開(kāi)展機器學(xué)習協(xié)作,合作訓練藥物發(fā)現模型。這一項目成功證明了制藥企業(yè)可通過(guò)云計算進(jìn)行合作來(lái)加速發(fā)現新藥物的可行性。
中國的藥物研發(fā)領(lǐng)域的眾多企業(yè)在迎來(lái)政策激勵的同時(shí),也開(kāi)始發(fā)掘AIDD背后的商業(yè)潛力。在輔助臨床前試驗階段之外,AI技術(shù)尚存在更多可發(fā)掘的應用潛力,如AI與物聯(lián)網(wǎng)、數據湖倉等技術(shù)融合,可促進(jìn)數字化實(shí)驗、多中心臨床、智能制造及真實(shí)世界分析等藥物的全流程改進(jìn)。越來(lái)越多的企業(yè)也逐步開(kāi)始了AIDD的實(shí)質(zhì)性應用,并助推國內藥物研發(fā)進(jìn)入新的 "高產(chǎn)" 階段。
據Data Bridge Market Research分析,亞太地區藥物發(fā)現市場(chǎng)的AI價(jià)值復合年增長(cháng)率將在2022至2029 年期間達到50.9%,且預計中國將成為該領(lǐng)域主導國家。隨著(zhù)云計算不斷為AIDD等AI應用落地鋪平道路,國內制藥企業(yè)將有望完成研發(fā)能力躍遷,讓上述預測成為最終事實(shí)。
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com