斯坦福、微软联手,用扩散模型进行蛋白质结构生成,已开源
来源:51CTO.COM
时间:2023-04-28 08:31:59 212浏览 收藏
从现在开始,我们要努力学习啦!今天我给大家带来《斯坦福、微软联手,用扩散模型进行蛋白质结构生成,已开源》,感兴趣的朋友请继续看下去吧!下文中的内容我们主要会涉及到等等知识点,如果在阅读本文过程中有遇到不清楚的地方,欢迎留言呀!我们一起讨论,一起学习!
蛋白质对生命至关重要,几乎在每个生物过程中都发挥着作用。一方面它们能在神经元之间传递信号、识别微观入侵者并激活免疫反应等。另一方面,蛋白质作为一种治疗介质已经得到广泛研究,成为治疗疾病的一部分。因此,通过生成新的、物理上可折叠的蛋白质结构,打开了利用细胞通路治疗疾病新方法的大门。
本文中,来自斯坦福大学、微软研究院等机构的研究者,他们受体内蛋白质折叠过程的启发,从而引入了一个折叠扩散( folding diffusion,FoldingDiff )模型,该模型通过镜像蛋白质天然折叠过程来设计蛋白质主链结构。
- 论文地址:https://arxiv.org/pdf/2209.15611.pdf
- 代码地址:https://github.com/microsoft/foldingdiff
具体而言,他们将蛋白质主链结构描述为一系列连续的角度,以捕捉组成氨基酸残基的相对方向,这种表示的固有位移和旋转不变性极大地减轻了对复杂等变网络的需要。
该研究基于 transformer 骨干训练了一个去噪扩散概率模型,并证明本文的模型可以无条件地生成高度逼真的蛋白质结构,其复杂性和结构模式类似于天然蛋白质。
有网友表示:不知道这个模型是否会为 AlphaFold 带来一些竞争。
方法及结果
我们可以将蛋白质理解为是可变长度的氨基酸残基链,典型氨基酸有 20 种,享有相同的三原子 N - C_α - C 主链,但具有不同的侧链连接到 C_α 原子上(通常表示为 R,参见图 1 所示 )。
这些残基组装形成聚合物链,折叠成 3D 结构,其形状在很大程度上决定了蛋白质的功能。这些折叠结构可以用四个层次来描述:
- 一级结构,简单地捕捉氨基酸的线性序列;
- 二级结构,描述氨基酸的局部排列;
- 三级结构,描述所有残基的完整空间排列;
- 四级结构,描述多个不同的氨基酸链如何聚集在一起形成更大的复合物。
该研究提出了一个简化的蛋白质主链框架,它遵循蛋白质折叠的生物学过程,同时消除了复杂的等变网络的需要。与其将长度为 N 个氨基酸的蛋白质主链视为三维坐标,他们把它看作由六个内角、连续角组成的序列。也就是说,给定当前残基的位置,六个内角的向量描述了下一个残基中所有主链原子的相对位置。这些内角可以使用三角函数轻松计算,迭代地将原子添加到蛋白质骨架中,然后在转换回 3D 笛卡尔坐标。
下图为一项实验结果。自然结构的 Ramachandran 图(图 a)包含三个区域,分别对应于 LH α螺旋、RH α 螺旋和β sheet。所有这三个区域都在本文生成的结构中全部再现(图 3b)。换句话说,FoldingDiff 能够生成蛋白质主链中的二级结构元素。此外,实验还表明 FoldingDiff 模型能够正确地了解到 RH α 螺旋比 LH α 螺旋更常见。而先前的工作使用等变网络,是无法区分这两种类型的螺旋的。
下图为在测试主链 (4a) 和生成主链 (4b) 中出现二级结构的二维直方图,结果表明生成的结构反映了蛋白质真实的结构,有多个α螺旋,多个β sheets ,以及两者的混合。
下图表明,在生成的 780 个结构中有 111 个(占比为 14.2%)是可设计的,其 scTM 评分≥0.5(图 5a),高于 Trippe 等人报告的 11.8% 的值。我们还看到,生成的主链与训练示例更相似,往往具有更好的可设计性(5b)。
了解更多内容,请阅读原论文。
今天关于《斯坦福、微软联手,用扩散模型进行蛋白质结构生成,已开源》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于开源,模型的内容请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
234 收藏
-
465 收藏
-
100 收藏
-
307 收藏
-
280 收藏
-
121 收藏
-
194 收藏
-
417 收藏
-
430 收藏
-
315 收藏
-
319 收藏
-
170 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习