比传统方法高30倍,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点
来源:机器之心
时间:2024-06-25 22:54:50 381浏览 收藏
小伙伴们有没有觉得学习科技周边很有意思?有意思就对了!今天就给大家带来《比传统方法高30倍,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点》,以下内容将会涉及到,若是在学习中对其中部分知识点有疑问,或许看了本文就能帮到你!
糖类是自然界中最丰富的有机物质,对生命至关重要。了解糖类如何在生理和病理过程中调节蛋白质,可以为解决关键的生物学问题和开发新的治疗方法提供机遇。
然而,糖类分子的多样性和复杂性,对实验识别糖-蛋白质结合以及相互作用的位点提出了挑战。
在这里,中国科学院团队开发了一种深度学习模型 DeepGlycanSite,它能够准确预测给定蛋白质结构上的糖结合位点。
DeepGlycanSite 将蛋白质的几何和进化特征融入具有 Transformer 架构的深度等变图神经网络中,其性能显著超越了之前的先进方法,并能有效预测各种糖类分子的结合位点。
结合诱变研究,DeepGlycanSite 揭示了重要 G 蛋白偶联受体的鸟苷-5'-二磷酸糖识别位点。
这些发现表明 DeepGlycanSite 对于糖结合位点预测具有重要价值,并可以深入了解具有治疗重要性蛋白质的糖类调节背后的分子机制。
该研究以「Highly accurate carbohydrate-binding site prediction with DeepGlycanSite」为题,于 2024 年 6 月 17 日发布在《Nature Communications》。
糖在所有生物体的细胞表面普遍存在,它们与多种蛋白质家族如凝集素、抗体、酶和转运蛋白相互作用,调节免疫反应、细胞分化和神经发育等关键生物学过程。理解糖类与蛋白质的相互作用机制是开发糖类药物的基础。
然而,糖类结构的多样性和复杂性,尤其是它们与蛋白质结合位点的多变性,给实验数据的获取和药物设计带来了挑战。
图示:糖类分子的复杂性和糖结合位点的多样性。(来源:论文)
过去,传统的结合位点预测方法不适用于结构复杂、大小变化大的糖类分子。加之高分辨率糖-蛋白质复合物结构数据的稀缺,导致预测模型的性能受限。
近年来,随着蛋白质数据库(PDB)和开放糖组学资源的快速发展,学界已经积累了超过 19000 个此类复合物的结构数据。这些高质量数据的增加,为采用 AI 技术开发精确的糖结合位点预测模型提供了可能,从而有望加速糖类药物的发现和优化过程。
在最新的研究中,中国科学院团队引入了 DeepGlycanSite,这是一种深度等变图神经网络 (EGNN) 模型,能够准确预测具有目标蛋白质结构的糖结合位点。
图示:DeepGlycanSite 概述。(来源:论文)
该团队利用几何特征(例如残基内和残基间的方向和距离)以及进化信息,在 DeepGlycanSite 中以残基级别的图形表示形式呈现蛋白质。结合具有自注意力机制的 Transformer 块来增强特征提取和复杂关系发现。
在涉及一百多种独特糖结合蛋白的独立测试集上,研究人员将 DeepGlycanSite 与当前最先进的计算方法进行了比较。
结果显示,DeepGlycanSite (0.625) 的平均马修斯相关系数(MCC) 是 StackCBPred (0.018) 的 30 倍以上,同时远超其他序列基础的预测方法。
传统配体结合位点方法可能因疏水性或小尺寸而排除简单糖类分子的结合位点,而 DeepGlycanSite 则能有效识别这些位点。
图示:比较模型在预测不同糖结合位点方面的表现。(来源:论文)
并且,DeepGlycanSite 在预测蛋白质上的多个糖结合位点方面也表现出色,这对于理解多价糖缀合物如何影响糖-蛋白相互作用以及生物过程的调控具有重要价值。例如,多价糖缀合物被设计成化学工具和药物候选物,以影响糖类分子与凝集素之间的相互作用。
与传统的仅使用蛋白质序列或结构信息的方法不同,DeepGlycanSite 充分考虑了蛋白质的几何信息及进化特性,这可能是其表现优异的关键因素。
此外,给定查询糖类分子的化学结构,DeepGlycanSite 还可以预测其特定结合位点。
图示:查询糖的特定结合位点预测。(来源:论文)
研究人员探索了 DeepGlycanSite 对功能重要的 G 蛋白偶联受体 (GPCR) 的应用。利用 AlphaFold2 预测的蛋白质结构和糖类化学结构,DeepGlycanSite 成功检测到了人类 P2Y14 上 GDP-Fuc 的具体结合位点。
虽然 AlphaFold2 预测的侧链质量有待提高,但 DeepGlycanSite 对蛋白质结构准确性的依赖较低,能够使用预测的蛋白质结构提供糖-蛋白相互作用的见解。
综上所述,DeepGlycanSite 在独立测试集和体外案例研究中的验证表明,它是一个有效的糖结合位点预测工具。研究人员可以利用 DeepGlycanSite 预测目标蛋白质上的糖结合口袋,从而促进对糖-蛋白质相互作用的理解。
糖类在生物学功能中扮演着关键角色,DeepGlycanSite 不仅有助于解析糖类分子和糖结合蛋白的生物学功能,也为糖类药物的开发提供了有力工具。
论文链接:https://www.nature.com/articles/s41467-024-49516-2
终于介绍完啦!小伙伴们,这篇关于《比传统方法高30倍,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
217 收藏
-
272 收藏
-
431 收藏
-
375 收藏
-
275 收藏
-
233 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 541次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 506次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习