更简单、更清晰,解析核酸、蛋白、细胞等结构,AI实现快速分子模式挖掘
来源:机器之心
时间:2024-10-12 18:00:48 144浏览 收藏
小伙伴们有没有觉得学习科技周边很有意思?有意思就对了!今天就给大家带来《更简单、更清晰,解析核酸、蛋白、细胞等结构,AI实现快速分子模式挖掘》,以下内容将会涉及到,若是在学习中对其中部分知识点有疑问,或许看了本文就能帮到你!
1. 编辑 | 白菜叶- 低温电子断层扫描技术可以以纳米级分辨率对细胞三维结构进行常规可视化。当与单粒子断层扫描技术相结合时,可以获得原生环境中常见大分子的近原子分辨率结构。
- 低温电子断层扫描/单粒子断层扫描(CET/SPT)面临的两个突出挑战是蛋白质的自动识别和定位,这两项任务受到细胞内分子拥挤、低温电子断层扫描断层图像特有的成像失真以及断层扫描数据集的庞大规模的阻碍。
- 目前的方法存在准确度低、需要大量且耗时的手动标记或仅限于检测特定类型的蛋白质的问题。
- 杜克大学(Duke University)的研究人员提出了 MiLoPYP,这是一个两步式数据集特定对比学习框架,可实现快速分子模式挖掘,然后进行准确的蛋白质定位。
- MiLoPYP 能够有效检测和定位各种目标,包括球状和管状复合物以及大型膜蛋白,这将有助于简化和扩大高分辨率工作流程在原位结构测定中的适用性。
- 该研究以「MiLoPYP: self-supervised molecular pattern mining and particle localization in situ」为题,于 2024 年 9 月 9 日发布在《Nature Methods》。1. 细胞样本制备、断层扫描数据收集和图像处理最新进展已使 CET/SPT 成为高分辨率确定天然状态下蛋白质结构的首选技术。
- 然而,一个尚存的技术挑战是缺乏计算工具来有效地筛选 CET 捕获的拥挤细胞环境的内在复杂性。
- 为了应对这些挑战,杜克大学的研究团队开发了 MiLoPYP,一个用于分子模式挖掘的强大且特定于数据集的框架,它有助于细胞内容探索,并允许检测包括球状、膜附着和纤维状蛋白质在内的多种目标。
- MiLoPYP 是一个深度学习框架,由细胞内容挖掘和探索模块以及蛋白质特定粒子定位模块组成。这两个模块都只需要极少的监督,从而提高了它们的实用性。
- 在细胞内容探索模块中,MiLoPYP 不使用以每个体素为中心的简单滑动窗口方法,而是利用高斯差 (DoG) 金字塔来识别感兴趣的关键坐标,从而提高了计算效率。
- 然后从断层图像中提取以这些坐标为中心的子体积,并将其输入用于表征学习的 Siamese 网络。通过利用成对的增强子体积作为输入,网络可以最大限度地提高每个子体积与其增强子体积之间的相似性,从而无需使用真实标签。图示:MiLoPYP 模块概述,用于自监督细胞内容探索和半监督粒子定位。(来源:论文)
经过训练后,网络可以有效地学习将形状相似的蛋白质组合在一起,同时将形状不同的蛋白质分配给远距离表示。
MiLoPYP 提供了三种方法来可视化学习到的嵌入:
1、对于 2D 网格可视化,2D 特征向量被分配给子断层图的各个 xy 切片,并放置在根据归一化特征坐标值着色的 2D 网格上。
2、对于 3D 断层图可视化,MiLoPYP 允许通过根据其归一化的 2D 表示为断层图中的每个体素分配不同的颜色来映射数据集中存在的结构多样性,其中相似颜色的体素表示结构同质的特征。
3、对于 3D 嵌入交互会话,首先使用过度聚类算法为嵌入分配离散标签,并根据其嵌入坐标进行着色。
1. 图示:细菌细胞内天然核糖体的结构映射和精确识别。(来源:论文)- 用户可以交互方式选择嵌入空间的特定区域,并通过将块映射到其原始断层图像位置来方便地可视化块。
- MiLoPYP 的可视化工具允许用户方便地探索和选择大量断层图像中频繁出现的粒子子集,并将其用作蛋白质定位模块的输入。
- 由于原始的基于 DoG 的坐标通常精度较低,因此需要进行细化步骤来提高蛋白质定位的准确性。
- MiLoPYP 的细化步骤以半监督方式进行训练,并生成一个概率热图,该图表示给定蛋白质在断层图像中每个体素中存在的可能性。
- 然后对该概率热图应用非最大抑制 (NMS),然后使用用户定义的概率值进行后处理和阈值处理。细化步骤产生的位置构成最终的 3D 坐标输出,用于后续的 SPT 细化。图示:从原位片层中同时识别和确定多种蛋白质的结构。(来源:论文)
MiLoPYP 提供了一种便捷的工具来绘制细胞内部图谱,并找到多种蛋白质在其原生环境中的位置,这是 SPT 进行高分辨率分析所必需的。MiLoPYP 无需费力的手动标记,即可有效地绘制整套断层图谱,从而有助于解释、发现和选择目标大分子。
除了精确识别球状大分子外,MiLoPYP 还可以准确检测膜结合和管状复合物,使其成为原位分子模式挖掘的多功能工具。重要的是,该框架具有计算效率,能够处理数百张断层图,这是高分辨率 SPT 分析所需的。
开源地址:https://github.com/nextpyp/cet_pick
用户指南:https://nextpyp.app/milopyp/
论文链接:https://www.nature.com/articles/s41592-024-02403-6
本篇关于《更简单、更清晰,解析核酸、蛋白、细胞等结构,AI实现快速分子模式挖掘》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
221 收藏
-
174 收藏
-
343 收藏
-
160 收藏
-
168 收藏
-
217 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习