蛋白预测从数月缩短至数小时,MassiveFold出于AlphaFold而胜于AlphaFold3
来源:机器之心
时间:2024-11-24 12:15:58 400浏览 收藏
哈喽!今天心血来潮给大家带来了《蛋白预测从数月缩短至数小时,MassiveFold出于AlphaFold而胜于AlphaFold3》,想必大家应该对科技周边都不陌生吧,那么阅读本文就都不会很困难,以下内容主要涉及到,若是你正在学习科技周边,千万别错过这篇文章~希望能帮助到你!
编辑: KX
蛋白质结构预测:一个飞速发展的领域
蛋白质结构预测领域正蓬勃发展。生物技术研究高度依赖于发现正确的蛋白质结构来执行特定任务,这影响着几乎所有生物技术领域,从食品到药品,从时尚到生物燃料,从洗衣粉到农业。
AlphaFold 的革命性影响
AlphaFold 彻底改变了蛋白质结构预测,实现了单链和复杂蛋白质组装的建模。然而,它需要大量计算且耗时。
MassiveFold:AlphaFold 的优化版本
法国里尔大学和瑞典林雪平大学的科学家开发了 MassiveFold,这是 AlphaFold 的优化和可定制版本,可将蛋白质结构预测的计算时间从数月大幅缩短至数小时。
出色的性能
与 AlphaFold3 相比,比较分析表明 MassiveFold 可为多个 CASP15 靶标生成高质量的模型,甚至在某些情况下表现更佳。
增强蛋白质结构建模
MassiveFold 有效地增强了蛋白质和蛋白质组装的结构建模,降低了计算成本,提高了预测质量,并可在各种硬件设置中扩展。它可以在从单台计算机到大型 GPU 基础设施的任何设备上运行,充分利用所有计算节点。
发表
相关研究题为《MassiveFold:通过优化和并行化大规模采样揭示 AlphaFold 的隐藏潜力》,已于 11 月 11 日发表在《Nature Computational Science》上。
AlphaFold 的计算成本和时间消耗
- AlphaFold 中的大规模采样提升了结构多样性,结合其高效的置信度排名,增强了单体结构和蛋白质组装的建模能力。
- 然而,这种方法对 GPU 成本和数据存储提出了挑战。
MassiveFold:AlphaFold 的并行化版本
- 为应对上述挑战,法国里尔大学的研究人员开发了 MassiveFold,它是 AlphaFold 的并行化、可定制版本,将计算任务分配到 CPU 和 GPU 之间,加快蛋白质结构预测。
- MassiveFold 结合了 AlphaFold 的框架、AFsample 的增强采样和 ColabFold 的附加功能。
- MassiveFold 是一个并行化引擎,可调用结构预测工具(如 AFmassive 或 ColabFold),并对结果进行后处理。
- MassiveFold 包含 AlphaFold 已发布的所有神经网络模型,这些模型包含增加结构多样性的参数,并可指定仅保留最有前景的预测结果。
- MassiveFold 可并行运行多个实例,每个 GPU 最多执行一次预测,充分利用可用计算基础设施,大幅缩短预测结果的获取时间。
- MassiveFold 的安装和使用都很简单,只需使用 JSON 参数文件运行简单的命令行。
- MassiveFold 采用了优化并行化,包括:在 CPU 上进行比对计算、在 GPU 上进行分批结构推断,以及在 CPU 上进行最终后处理步骤(收集结果、对预测排序、生成图表)。
MassiveFold 的后处理汇总了所有预测结果并生成了多个图。
图 2: MassiveFold 使用 AFmassive 生成的用于 CASP15 多聚体靶标 H1140 结构预测的图表。
MassiveFold 通过优化采样参数、回收和 dropout,增强了蛋白质结构预测的多样性和置信度,从而为复杂靶标创建了高置信度的结构。例如,在 CASP15 H1140 靶标中,MassiveFold 通过扩展采样和应用无模板 dropout,生成了多个具有高置信度分数的不同结构。
1. 在 CASP15 靶标上对 MassiveFold 和 AlphaFold3 进行比较的测试表明,MassiveFold 的大规模采样方法为八个靶标中的七个生成了良好的模型,而 AlphaFold3 仅在八个靶标中的三个上略胜于 MassiveFold。
2. 未来,将 AlphaFold3 与 MassiveFold 整合
未来,可以将 AlphaFold3 集成到 MassiveFold 中,结合两种工具的独特优势,从而进一步增强抗体-抗原预测模型。
3. MassiveFold 显著缩短了蛋白质结构预测的计算时间,从数月缩短到数小时。这种效率的提升,可以使研究人员能够更快地获得结果,从而加速蛋白质建模和相关科学领域的进步。
4. 此前,AlphaFold 中的大规模采样已用于生成大量蛋白质结构预测,来探索各种可能的构象,从而提高对复杂蛋白质组装建模的准确度。
5. MassiveFold 解决了传统 AlphaFold 应用程序面临的高 GPU 资源需求和数据存储挑战。它能够并行运行预测,即使在计算资源有限的情况下也非常实用。
6. MassiveFold 还具有可扩展性和可定制性,能够在从单台计算机到大型 GPU 基础设施的任何设备上运行。这种灵活性使其能够充分利用所有可用的计算节点,使其可用于各种研究环境。
7. 根据这项研究,该程序易于使用和安装,只需要一个带有 JSON 参数文件的简单命令行。
8. MassiveFold 的代码在 GitHub 和 Zenodo 上公开可用。
GitHub 地址:https://github.com/GBLille/MassiveFold
参考内容:
- https://phys.org/news/2024-11-massivefold-customizable-version-alphafold-protein.html
- https://www.news-medical.net/news/20241112/MassiveFold-advances-protein-structure-prediction-with-efficient-parallel-processing.aspx
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
231 收藏
-
302 收藏
-
302 收藏
-
334 收藏
-
284 收藏
-
396 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习