石大要闻

当前位置: 首页 > 石大要闻 > 正文

自然科学基金委报道我校在蛋白质二级结构人工智能识别方面研究新进展

发布时间:2022-06-02 09:49:22点击数:字号:
分享到:
我要评论 0

【本站讯】近日,国家自然科学基金委将我校郭文跃教授团队在蛋白质二级结构人工智能识别方面研究新进展,作为标志性资助成果,在国家自然科学基金委员会网站报道。

该项成果由我校材料科学与工程学院郭文跃教授团队与中国科学技术大学江俊教授、美国加州大学Irvine分校Shaul Mukamel教授合作研究,发展了基于二维紫外(2DUV)光谱信号智能识别蛋白质二级结构的方案,成果以《基于二维光谱描述符的蛋白质二级结构机器学习识别》(Machine Learning recognition of protein secondary structures based on two-dimensional spectroscopic descriptors)为题,在线发表于《美国国家科学院院刊》(Proc. Natl. Acda. Sci. U.S.A. 2022, e2202713119)。材料科学与工程学院任浩副教授为论文第一作者,中国石油大学(华东)为第一署名单位。

17世纪,牛顿在著作《光学》中提到:“若要了解物质内部的结构情况,只要看其光谱就可以了。”“看其光谱”一直都是人类探测物质微观结构并推演规律的重要手段。然而,“看其光谱”从而了解结构的传统光谱解读方法依赖专家的长期经验和高精度计算,成本高、效率低,随着海量的光谱数据不断产生,遇到了难以克服的困难。发展能替代人类专家的人工智能方法,驱动机器进行自动解读光谱信号并反演结构信息,成为学术界和产业界一个共同而又紧迫的梦想。

光谱信号来自于样品对入射光的响应,对应于体系微观状态间的跃迁。不同体系具有不同的微观特性,导致光谱信号不同;基于这一点,也可通过测量样品的光谱信号推断其化学组成和微观结构。然而,光谱测量是一个“信息降维”的过程,光谱信号相当于物质在高维构型空间的组成和结构信息在某个低维频域空间的投影。不依靠专家知识、经验和模拟计算中隐含的物质信息,直接利用机器进行“信息升维”操作,从一维的光谱信息中还原高维的物质结构信息,这是一个巨大挑战。

鉴于此,郭文跃教授团队在前期利用机器学习技术自动识别分子结构的工作基础上,结合多尺度理论计算和机器学习技术,构建了包含14.8万个蛋白质片段及对应光谱的数据库,实现了基于2DUV信号的二级结构识别专家系统。2DUV可将样品不同电子激发之间的耦合信息呈现为频率空间的二维强度分布。相比传统的一维线性光谱(如紫外可见谱、圆二色谱等),2DUV具备广阔的二维特征空间,携带了远超传统一维光谱的微观结构信息。在该项研究工作中,作者将2DUV信号作为光谱描述符,结合卷积神经网络(CNN)和迁移学习技术,实现了基于光谱数据的二级结构识别,对蛋白质二级结构的识别准确率达到97%,大幅超越了基于一维光谱的识别效果。相对于一维光谱描述符,2DUV能够提供更高的维度用于容纳体系内部的相互作用特征,使建立稳定的“结构—光谱”关联成为可能。

该研究成果表明,将光谱信号看作频域序列,结合成熟的模式识别技术,可实现自动的光谱学信号解读,为分子结构的实时、动态表征提供了坚实的理论和技术支持。人工智能技术赋能传统多尺度模拟,将显著促进光谱学技术对微观结构和功能演化的动态跟踪能力。

审稿专家认为,此项工作“使用严谨的方法清晰地论证了包含激子耦合项的必要性,对同源和非同源蛋白质片段二级结构的识别准确率超过90%是一项不同寻常的成就”,激起了开展此类研究的兴趣和动力,并展示了如何实施此类研究的细节。

本文工作涉及的数据和模型均可通过访问团队在Github(https://github.com/MTSD-UPC)的页面获取。

郭文跃教授带领的材料理论、模拟与设计团队致力于结合第一性原理计算、多尺度模拟方法和机器学习技术,在分子光谱表征、能源材料理性设计、纳米材料生长机理和材料基因方法学研究等方面,发展了一系列新型理论计算方法和实用软件,为高效辅助物质科学领域的实验和应用研究提供了重要的理论工具和数据支撑。

国家自然科学基金委网站报道链接:http://chem.nsfc.gov.cn/Show.aspx?AI=1193

论文链接:https://www.pnas.org/doi/10.1073/pnas.2202713119


【 作者:刘玉丽 张勇 来自:材料科学与工程学院 科技处  责任编辑:姜洪明 审核:徐永涛】

关闭

请遵守《互联网电子公告服务管理规定》及中华人民共和国其他有关法律法规。
用户需对自己在使用本站服务过程中的行为承担法律责任。
本站管理员有权保留或删除评论内容。
评论内容只代表网友个人观点,与本网站立场无关。
 匿名发布 验证码 看不清楚,换张图片
0条评论    共1页   当前第1

联系方式

联系电话:(0532)86983218

网站维护:中国石油大学(华东)大学生融媒体中心

地址:青岛市黄岛区长江西路66号 邮编:266580


  • 学习强国号
  • 中国教育发布
  • 山东教育发布
  • 石大新浪微博
  • QQ空间
  • 石大官方微信