近日,中国科学技术大学认知智能全国重点实验室教授刘淇指导的博士研究生张载熙,联合美国哈佛大学医学院教授Marinka Zitnik课题组,设计了基于图表示学习和蛋白质语言模型的深度生成算法PocketGen,生成了与小分子结合的蛋白质口袋序列和空间结构。实验验证显示,PocketGen在生成成功率和效率方面均超过传统方法。相关研究成果以Efficient Generation of Protein Pockets with PocketGen为题,发表在《自然-机器智能》(Nature Machine Intelligence)上。
研发适用于科学发现任务的人工智能算法如功能蛋白质设计是重要的研究方向。在药物发现和生物医疗领域,设计与小分子结合的功能蛋白质具有积极意义。而基于能量优化和模板匹配的传统方法计算速度慢、成功率低。基于深度学习的模型存在分子-蛋白质复杂相互作用建模难、序列-结构依赖关系学习难等问题。因此,亟待发展高效、高成功率且能够准确反映物理化学规律的蛋白质口袋生成算法。
该团队在前期蛋白质口袋生成工作FAIR和PocketFlow的基础上,研发出PocketGen。PocketGen可以基于蛋白质框架和结合小分子生成蛋白质口袋序列和结构。PocketGen主要由双层图Transformer编码器和蛋白质预训练语言模型组成。受蛋白质固有的层级结构启发,双层图Transformer编码器包括氨基酸层级编码器和原子层级编码器,学习不同细粒度的相互作用信息,更新氨基酸/原子表示和坐标。在蛋白质预训练语言模型中,PocketGen高效微调ESM2模型,辅助氨基酸序列预测。具体方法为PocketGen固定大部分模型层不变,仅微调部分适应层参数,计算序列-结构信息交叉注意力,增强序列-结构一致性。实验显示,PocketGen模型亲和力和结构合理性等指标超过传统方法,在计算效率方面亦有大幅提高。
进一步,该研究在芬太尼和艾必克等小分子结合蛋白质口袋设计任务中进行验证,并与生成模型RFDiffusion、RFDiffusionAA等比较,验证了PocketGen的有效性。同时,研究将PocketGen产生的注意力矩阵与基于第一性原理和力场模拟分析软件得到的结果进行对比展示,发现基于深度学习的PocketGen具有较好可解释性。
上述成果推进了深度生成模型用于功能蛋白质设计,为进一步剖析蛋白质设计规律并开展生物实验验证奠定了基础,展现了人工智能方法在解决药物研发和生物工程领域重要科学问题方面的优势。
研究工作得到国家自然科学基金等的支持。
论文链接
(a)利用PocketGen进行蛋白质序列-结构共同设计;(b)双层图Transformer编码器;(c)蛋白质预训练语言模型用于序列预测及高效微调技术
左侧为薛定谔软件分析的蛋白质-小分子相互作用关系图;右侧是PocketGen两个注意力矩阵头的热图,与左侧相互关系成功对应。
新闻网讯 11月4日,《自然-纳米技术》(Nature Nanotechnology)在线发表华中科技大学生命学院、国家纳米药物工程技术研究中 短双歧杆菌CCFM683,是一个专利菌株的名字。它由中国高校历时近10年研究开发,通过进博会与跨国企业合作开展临床试验,推出 “努力培养更多高素质新闻传播人才,为党的宣传思想文化事业发展作出新的贡献”。在中国传媒大学建校70周年之际,习近平总书记给学校全体师生回信,向全校师生员工、广大校友致以祝贺和问候,寄以期待与厚望。 殷殷关 2024年11月13日,江苏省宿迁市公安局宿城分局府苑派出所组织民警走进辖区学校开展法治宣讲活动。民警通过案例讲解、互动问答等方式,向学生们宣传防网络诈骗、防校园欺凌、防网络谣言、防毒禁毒 ◎摘 要 加大对学生的认知规律和接受特点的研究,发挥学生主体性作用,对推动思政课建设内涵式发展,不断提高思政课的针对性和吸引力具有重要意义。思政课的传统教学方式在大学生心理接受方面存 中国教育报-中国教育新闻网讯(记者 史望颖 通讯员 金挺 陈波)“在一个小时内,我们完成了‘盛世芳华’插花作品,让这个源于‘两山理论’灵感的花艺展示在世界舞台上绽放。”近日,随着宁波城市职业 。本文链接:科学家设计出基于图表示学习和蛋白质语言模型的深度生成算法http://www.sushuapos.com/show-12-501-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 科学家制备出新型硅酸盐沸石分子筛
下一篇: 空间引力波探测信号识别研究获进展