兩年前,將人工智能(AI)用于藥物研發(fā)的初創(chuàng )公司只有30家左右,而現在這個(gè)數目已經(jīng)飆升到了148家。這一統計雖然還不完全,但是它反映了AI在藥物研發(fā)中的迅猛發(fā)展。今年,美國著(zhù)名的硅谷銀行(Silicon Vally Bank, SVB)第一次推出了對數字健康領(lǐng)域的投資統計,在今年上半年,對這一領(lǐng)域的投資已達到52.6億美元,超過(guò)了2017年全年的投資總數,2019年全年投資總數有望超過(guò)100億美元!
可以說(shuō),AI技術(shù)的成熟出現在醫藥產(chǎn)業(yè)發(fā)展的關(guān)鍵節點(diǎn)上,由于新藥物靶點(diǎn)和作用機制越來(lái)越少,醫藥公司需要更多的投入和精力才能產(chǎn)出和以前相當的“first-in-class”藥物??朔@一障礙的方法包括提升研發(fā)效率,和深耕已有數據來(lái)發(fā)現新的洞見(jiàn)。AI在這兩個(gè)方面都可以大展身手。
然而,業(yè)界資深人士也表示,在A(yíng)I迅猛發(fā)展的同時(shí),我們需要警醒AI的研究方向是否走偏了。對AI能力的過(guò)度炒作可能會(huì )為這一領(lǐng)域帶來(lái)“AI的冬天”。今天藥明康德內容團隊將結合公開(kāi)資料,探討AI在藥物研發(fā)中的潛力和局限。
理解復雜的規則
給予足夠多的數據,機器學(xué)習算法能夠從中發(fā)現規律,然后利用這些規律來(lái)作出預測或者對新的數據進(jìn)行分類(lèi)。它們在這方面的表現遠遠快于任何人類(lèi)。當代的藥物研發(fā)團隊面對的挑戰是需要系統性地對海量數據進(jìn)行分析,這些挑戰已經(jīng)不是可以單靠人腦來(lái)完成的工作。AI尤其擅長(cháng)處理應用復雜的規則對大量數據進(jìn)行分析。麻省理工學(xué)院(MIT)計算機科學(xué)家,楊森(Janssen)公司的科學(xué)顧問(wèn)Regina Barzilay博士表示:“例如,當我們在學(xué)習化學(xué)的時(shí)候,我們學(xué)習了很多規則并且理解了化學(xué)反應的機制,然而有些時(shí)候,這些規則非常非常的復雜。如果我們能夠為計算機算法提供很多數據,并且將需要解決的問(wèn)題正確地呈現出來(lái),它們有可能捕捉到人類(lèi)無(wú)法捕捉到的規律。“
以藥物**為例,在過(guò)去50年里,世界范圍內有超過(guò)450款藥物在獲批上市之后因為毒副作用撤市,其中肝 臟**是最常見(jiàn)的原因。例如在1993年上市的治療皮膚真菌感染的特比萘芬(terbinafine)在上市之后被發(fā)現可能導致肝 臟**。截至2008年,已經(jīng)有3例因為肝功能衰竭而死亡的病例和70例其它肝 臟**被證明是由于特比萘芬造成的。然而,藥物在肝 臟中的代謝過(guò)程非常復雜,也非常難于預測。
這是機器學(xué)習可能幫助解決的典型問(wèn)題,而且我們已經(jīng)擁有了訓練AI的數據。美國聯(lián)邦政府的Tox21項目,通過(guò)美國環(huán)保局(EPA)、國家衛生研究院(NIH)和FDA的合作,構建了一個(gè)包含大量分子和它們對人類(lèi)關(guān)鍵性蛋白**的數據庫。這一數據庫可以被用來(lái)訓練AI,發(fā)現化合物結構、特征和功能與可能出現的毒副作用之間的關(guān)系。
名為Cloud Pharmaceuticals的生物技術(shù)公司已經(jīng)將這些數據整合到該公司的化合物篩選過(guò)程中。這家公司去年與大型藥企葛蘭素史克(GSK)達成一項研發(fā)合作協(xié)議。“使用這一數據集訓練機器學(xué)習算法之后,當新分子出現時(shí),AI能夠預測它是不是會(huì )具有**。”Cloud公司聯(lián)合創(chuàng )始人兼首席科學(xué)官Shahar Keinan博士說(shuō)。
設計更好的新藥
除了發(fā)現潛在**以外,機器學(xué)習算法還可以預測候選化合物在不同物理和化學(xué)環(huán)境下的反應,從而幫助藥物研發(fā)人員理解它們在人體不同組織中的行為?;F盧大學(xué)(University of Waterloo)的物理化學(xué)家Scott Hopkins博士正在與輝瑞(Pfizer)公司合作,訓練算法來(lái)評估候選分子吸收或者丟失水份的能力。
“如果一個(gè)藥物分子非常迅速地吸收水份并且不會(huì )讓水份流失,這意味著(zhù)這種藥物在水中很容易溶解,”Hopkins博士說(shuō):“它在胃中會(huì )很快溶解并且進(jìn)入血液循環(huán)。”這一算法通過(guò)分析89種小分子候選藥物結構與可溶性的關(guān)系,能夠準確預測出類(lèi)似分子的關(guān)鍵性特征。這項研究已經(jīng)在Nature Communications上發(fā)表。
對藥物潛在**和生化特征的篩查雖然是藥物開(kāi)發(fā)中不可缺少的步驟,但是對于A(yíng)I研究人員來(lái)說(shuō),在藥物研發(fā)中的“圣杯”是從頭生成一個(gè)新治療性分子的結構。
藥明康德的合作伙伴Insilico Medicine公司,正在使用稱(chēng)為“生成對抗網(wǎng)絡(luò )“(generative adversarial network, GAN)來(lái)開(kāi)發(fā)全新的小分子化合物,治療癌癥、代謝性疾病和神經(jīng)退行性疾病等嚴重疾病。這一算法由兩個(gè)互相對抗的深度神經(jīng)網(wǎng)絡(luò )構成。
第一個(gè)深度神經(jīng)網(wǎng)絡(luò )的任務(wù)是根據一系列化合物應該具有的功能和生化特征標準(例如溶解性、靶點(diǎn),或者生物利用度),生成分子結構。而另一個(gè)深度神經(jīng)網(wǎng)絡(luò )的作用是對第一個(gè)神經(jīng)網(wǎng)絡(luò )輸出的結構進(jìn)行“批評“。
“它們之間在相互競爭,“Insilico公司首席執行官Alexander Zhavoronkov博士說(shuō):”經(jīng)過(guò)無(wú)數次的迭代,它們能夠學(xué)會(huì )生成一些全新的結構。“
Insilico公司計劃針對多個(gè)孤兒藥靶點(diǎn)開(kāi)發(fā)候選藥物分子。
圖片來(lái)源:Insilico公司官網(wǎng)
人工智能的局限性
雖然人工智能在藥物開(kāi)發(fā)領(lǐng)域取得了很大的進(jìn)步,但是它們還無(wú)法取代人類(lèi)的作用。AI在藥物開(kāi)發(fā)中的作用就像一個(gè)智能廚房。“你可以有智能微波爐、咖啡機和其它智能工具,但是它們都沒(méi)法為你做出一道晚餐,“Barzilay博士說(shuō):”你需要將這些工具整合在一起來(lái)做出一道晚餐,它們只能夠幫助你做的更快更好。“
AI的表現受到輸入數據質(zhì)量的限制。在今年的藥明康德全球論壇上,業(yè)界的專(zhuān)家也表示,很多時(shí)候,用于訓練機器學(xué)習算法的高質(zhì)量數據并不存在。而低質(zhì)量的數據可能導致算法從數據中獲取虛假的信號,導致了“垃圾進(jìn),垃圾出“的擴大化。 現今存在的公開(kāi)數據往往由于格式、代表性等多種原因,無(wú)法成為高質(zhì)量的數據。對于有的AI藥物研發(fā)公司來(lái)說(shuō),解決這一難題的辦法是自己生成高質(zhì)量的數據。例如,insitro和Recursion公司都在根據解決特定問(wèn)題的需求,生成自己的數據。
而對于Gary Marcus博士來(lái)說(shuō),他的擔憂(yōu)是對AI能力的過(guò)度炒作可能帶來(lái)與實(shí)際不符的期望值。而看看AI開(kāi)發(fā)的歷史就可以看到,AI領(lǐng)域的開(kāi)發(fā)已經(jīng)在1974-1980年,和1987-1994年,經(jīng)歷過(guò)了兩個(gè)發(fā)展的“冬天“。由于期望不能夠得到實(shí)現,AI研究的政府和私人投資都大幅度減少。
Gary Marcus博士是紐約大學(xué)心理學(xué)和神經(jīng)科學(xué)教授,也是機器學(xué)習初創(chuàng )公司Geometric Intelligence的創(chuàng )始人和首席執行官。在他看來(lái),深度學(xué)習(deep learning)是非常出色的算法工具,然而它相當于一種超級記憶。能夠把所有想知道的東西都記下來(lái)當然不是件壞事,但是當遇到不常見(jiàn)的情況時(shí),它缺乏靈活性,表現并不算好。
他擔心的是,我們過(guò)于依賴(lài)深度學(xué)習這一種人工智能的構架。即便深度學(xué)習是一個(gè)完美的“錘子”,但是在醫藥領(lǐng)域需要解決的問(wèn)題卻不全是“釘子”。試圖使用一種工具來(lái)解決所有問(wèn)題是不恰當的,面對需要解決的問(wèn)題的多樣性,我們也需要有更為靈活和細致入微的思考方式?;蛱┛搜邪l(fā)掌門(mén)人Michael Varney博士也在日前的訪(fǎng)談中表現出對人工智能過(guò)度炒作的憂(yōu)慮。
提供更多的可能性
雖然業(yè)界人士表示,使用人工智能在藥物研發(fā)方面的應用存在著(zhù)過(guò)度的炒作,但是他們仍然對人工智能可能帶來(lái)的可能性非常興奮。無(wú)論是Marcus博士還是Varney博士,都在積極開(kāi)發(fā)和使用人工智能工具,協(xié)助新藥研發(fā)的過(guò)程。
“如果能夠將藥物發(fā)現的效率提高5倍到10倍,從經(jīng)濟學(xué)角度上講,研究人員可以探索更具風(fēng)險的研發(fā)項目,因為失敗的成本大大降低了。“華盛頓大學(xué)(Washington University)的S. Joshua Swamidass博士說(shuō)。他帶領(lǐng)的團隊使用機器學(xué)習,最終在2018年解開(kāi)了特比萘芬導致肝 臟**之謎。”想像一下,那樣我們可以有能力探索多少種難治疾病的創(chuàng )新療法!“
參考資料:
[1] Artificial Intelligence Shakes Up Drug Discovery. Retrieved August 24, 2019, from https://www.the-scientist.com/bio-business/artificial-intelligence-shakes-up-drug-discovery-65787
[2] AI startups are racing into drug development. Here’s 5 burning questions about which will survive. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/22/artificial-intelligence-drug-development-startups-growth/
[3] Machine learning brings cell imaging promises into focus. Retrieved August 24, 2019, from https://www.nature.com/articles/d41573-019-00144-2
[4] Bera et al., (2019). Artificial intelligence in digital pathology — new tools for diagnosis and precision oncology. Nature Reviews Clinical Oncology, https://doi.org/10.1038/s41571-019-0252-y
[5] Warning of an AI winter, a skeptic argues deep learning in medicine needs a reboot. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/21/ai-winter-deep-learning-oversold-in-medicine/
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com