亚洲第一大网站,欧美三级网络,日韩av在线导航,深夜国产在线,最新日韩视频,亚洲综合中文字幕在线观看,午夜香蕉视频

產(chǎn)品分類(lèi)導航
CPHI制藥在線(xiàn) 資訊 Nature子刊:李煜/尹鵬/王晟/孫思琦等開(kāi)發(fā)RNA語(yǔ)言模型,快速準確預測RNA三維結構

Nature子刊:李煜/尹鵬/王晟/孫思琦等開(kāi)發(fā)RNA語(yǔ)言模型,快速準確預測RNA三維結構

熱門(mén)推薦: RNA語(yǔ)言模型 預測 RNA三維結構
作者:王聰  來(lái)源:生物世界
  2024-12-09
2024年諾貝爾化學(xué)獎授予了 Demis Hassabis 和 John M. Jumper,以表彰他們在“蛋白質(zhì)結構預測”方面的貢獻,他們開(kāi)發(fā)的AlphaFold系統實(shí)現了對蛋白質(zhì)三維結構的準確預測。

       2024年諾貝爾化學(xué)獎授予了 Demis Hassabis 和 John M. Jumper,以表彰他們在“蛋白質(zhì)結構預測”方面的貢獻,他們開(kāi)發(fā)的AlphaFold系統實(shí)現了對蛋白質(zhì)三維結構的準確預測。

       然而,準確預測另一種生物大分子——RNA的三維結構,仍是一個(gè)尚未解決的挑戰。確定RNA的三維結構對于理解其功能、指導靶向藥物開(kāi)發(fā)和合成生物學(xué)設計至關(guān)重要。但RNA的結構靈活性導致已通過(guò)實(shí)驗確定的結構數據的稀缺,這使得計算預測工作變得復雜。

       近日,香港中文大學(xué)李煜、哈佛大學(xué)James Collins、尹鵬、智峪生科王晟、復旦大學(xué)孫思琦等人在 Nature 子刊 Nature Methods 上發(fā)表了題為:Accurate RNA 3D structure prediction using a language model-based deep learning approach 的研究論文。

       該研究使用RNA語(yǔ)言模型,實(shí)現準確、快速的RNA三維結構的從頭預測,在建模單鏈RNA方面顯示了很強的準確性,并在不同RNA家族和類(lèi)型中表現出良好的泛化能力,同時(shí)還能夠捕捉局部特征(例如螺旋間角和二級結構)。

Accurate RNA 3D structure prediction using a language model-based deep learning approach

       RNA在“中心法則”中發(fā)揮著(zhù)關(guān)鍵的承上啟下的作用。RNA結構如何影響基因調控和功能一直是研究的重點(diǎn)。聚焦于RNA靶向的研究表明,它可以作為藥物開(kāi)發(fā)的重要靶點(diǎn)和有用的合成生物學(xué)設計元件。

       超過(guò)85%的人類(lèi)基因組被轉錄為RNA,但只有3%的基因組編碼蛋白質(zhì),這凸顯出轉錄的RNA中有相當一部分功能和結構是未知的。在許多情況下,獲得高分辨率的結構信息可以使我們對所關(guān)注的RNA分子有具預測性的理解。

       RNA分子的構象靈活性使其三維(3D)結構的實(shí)驗測定具有挑戰性。截至2023年12月,RNA結構占蛋白質(zhì)數據庫(PDB)中約214000個(gè)結構的不到1.0%,而含RNA的復合物結構僅占2.1%。

       盡管X射線(xiàn)晶體學(xué)、核磁共振波譜學(xué)和冷凍電鏡技術(shù)取得了進(jìn)展,但這些低通量技術(shù)受到專(zhuān)業(yè)要求的限制。利用RNA序列數據的計算方法已成為RNA三維結構預測的補充方法。這些方法主要分為兩類(lèi):基于模板的建模(例如ModeRNA和RNAbuilder)和從頭預測(例如FARFAR2、3dRNA和SimRNA),前者受模板庫的限制,后者預測性更高,但由于大規模抽樣的要求,計算量更大。

       基于深度學(xué)習的方法,已被應用于預測蛋白質(zhì)三維結構、RNA二級結構,以及對其他方法生成的RNA結構進(jìn)行評分。由于RNA三維結構數據的匱乏,以往的RNA三維結構預測方法主要集中在基于模板或基于能量的抽樣技術(shù)上。盡管數據匱乏,AlphaFold2在蛋白質(zhì)結構預測方面的成功推動(dòng)了從頭深度學(xué)習方法在RNA三維結構預測方面的發(fā)展。這些新方法通常從單個(gè)輸入序列開(kāi)始,然后從它構建多序列比對(MSA),然后用于構建三維結構。

       多序列比對(MSA)已被證明為蛋白質(zhì)建模提供了額外信息,這可能對RNA也是如此。例如,DeepFoldRNA和trRosettaRNA利用transformer網(wǎng)絡(luò )將構建的MSA和預測的二級結構轉換為各種一維和二維的距離、方向和扭轉角度。然后,這些預測的幾何形狀被用作利用能量最小化來(lái)預測RNA三維結構的約束,并將抽樣和評分過(guò)程整合到其框架中。包括E2Efold-3D和RoseTTAFoldNA在內的幾個(gè)模型采用了完全可區分的端到端管線(xiàn),利用構建的MSA和二級結構約束直接預測全原子3D模型。

       AlphaFold2的繼承者AlphaFold3也能夠直接從輸入序列中預測RNA的3D結構,而在預測過(guò)程中仍然依賴(lài)于其構建的MSA。與其他方法相比,AlphaFold3采用了基于擴散(diffusion-based)的過(guò)程來(lái)預測原始原子坐標,取代了AlphaFold2結構模塊對氨基酸特定框架和側鏈扭轉角的操作。

       雖然這些基于MSA的方法能夠準確預測RNA的3D結構,但它們需要在大型序列數據庫中進(jìn)行廣泛的搜索,這可能很耗時(shí)。相比之下,基于單一序列(包括DRFold)的模型不使用MSA,因此不需要在大型序列數據庫中進(jìn)行大量搜索,相反,DRFold僅依靠預測的二級結構來(lái)預測三維結構。這種方法速度更快,但通常與基于MSA的方法相比準確性較低。下一代深度學(xué)習方法可能更好地利用基于MSA的方法,從而提高預測的速度和準確性。

       在這項新研究中,研究團隊提出了一種基于語(yǔ)言模型的深度學(xué)習方法——RhoFold+,能夠從序列信息中準確且快速從頭預測單鏈RNA的三維結構。

       通過(guò)整合預訓練的約2370萬(wàn)個(gè)RNA序列的RNA語(yǔ)言模型,并利用技術(shù)解決數據匱乏問(wèn)題,RhoFold+提供了一個(gè)完全自動(dòng)化的RNA三維結構預測端到端管線(xiàn)。

       對RNA-Puzzles(一個(gè)評估RNA三維結構預測的國際合作項目)和CASP15(蛋白質(zhì)結構預測比賽)天然RNA靶點(diǎn)的回顧性評估表明,RhoFold+優(yōu)于包括人類(lèi)專(zhuān)家組在內的現有方法。通過(guò)跨RNA家族和類(lèi)型評估以及時(shí)間限制的基準測試,進(jìn)一步驗證了RhoFold+的性能和普遍適用性。此外,RhoFold+還能預測RNA二級結構和螺旋間角,提供了可驗證的特征,拓寬了其在RNA結構和功能研究中的適用性。

RhoFold+的架構和用于性能評估的任務(wù)

RhoFold+的架構和用于性能評估的任務(wù)

       RhoFold+與它的前身RhoFold相比,實(shí)現了完全自動(dòng)化和差異化的改進(jìn),利用MSA和其他特性的改進(jìn)集成來(lái)提高性能,其主要重點(diǎn)是確定單鏈RNA的結構,因為單鏈RNA與其他分子的相互作用有限。解決這一挑戰可以幫助我們更好地理解RNA生物學(xué),并為解決更復雜的結構問(wèn)題提供起點(diǎn)。

       論文鏈接:https://www.nature.com/articles/s41592-024-02487-0

相關(guān)文章

合作咨詢(xún)

   肖女士    021-33392297    Kelly.Xiao@imsinoexpo.com

2006-2025 上海博華國際展覽有限公司版權所有(保留一切權利) 滬ICP備05034851號-57
西安市| 海盐县| 江城| 广水市| 沙雅县| 海淀区| 泰宁县| 井冈山市| 铜陵市| 瑞安市| 伊春市| 蚌埠市| 马边| 湖南省| 文登市| 沙河市| 临西县| 武川县| 会昌县| 阿克| 志丹县| 南昌市| 盘山县| 北海市| 海林市| 江山市| 察哈| 玉门市| 齐齐哈尔市| 阳山县| 万山特区| 平阳县| 沾益县| 静宁县| 武隆县| 邛崃市| 苗栗市| 香格里拉县| 古蔺县| 绥江县| 兴化市|