谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源
来源:搜狐
时间:2023-09-21 14:10:11 220浏览 收藏
科技周边小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!
需要重新书写的内容是:鱼羊发自凹非寺
量子位 | 公众号 QbitAI
基因突变会如何影响人类健康,很大程度上还是个未解之谜。
不过现在,人类可以借AI之力来研究这件事儿了:
谷歌DeepMind在AlphaFold的基础上,训练出了专门预测人类基因组中错义突变致病性的AlphaMissense。
今天,一篇论文被发表在《科学》杂志上
“错义突变”是DNA序列的一种非同义替换。简单来说,就是DNA原本的字母(碱基对)被替换掉了。
这就意味着,对应生成的蛋白质里的氨基酸也会发生异化,这可能会让蛋白质失去原本的功能,导致疾病的产生。
AlphaMissense出山第一步,就是对全部7100万种可能的错义突变进行了分类。
AI成功将这些变异中的89%准确分类为“可能致病”和“可能良性”。与此相比,人类专家目前的准确率仅为0.1%
使用人工智能来预测基因突变的致病性
一句话总结,AlphaMissense的主要能力,就是预测人类基因组中所有可能的错义突变是致病性的还是良性的。
如何实现——
AlphaMissense基于DeepMind的蛋白质结构预测模型AlphaFold打造。
研究人员对AlphaFold进行了微调,使用了人类和灵长类变异频率数据库。具体来说,常见的自然界变异被视为对生物无害的变异,而数据库中未出现的变异则被视为“致病变异”训练数据
这种训练策略,可以避免人工标注带来的偏见。
需要重新写的内容是:AlphaMissense无法预测突变后蛋白质结构的变化以及突变对蛋白质稳定性的其他影响
AlphaMissense在输入一种错义突变后,会结合蛋白质的结构上下文和蛋白质语言模型,对突变进行一个0-1分的评分,以此大致判断这种突变是否会导致疾病
△AlphaMissense+AlphaFold效果
那么问题来了,AlphaMissense的这种分类,真的可靠吗?
经过实验验证,研究人员对此进行了验证
在遗传学权威数据库ClinVar中,AlphaMissense显示出比其他计算方法更强大的分类性能
在18924个变异数据中,AlphaMissense的ROC曲线下面积(auROC)为0.94。这个数字越接近于1,就意味着模型越能够准确地区分正样本和负样本
值得注意的是,上图中,以灰色显示的计算方法是在ClinVar上训练的,可能存在过拟合。
AlphaMissense在预测准确率方面也达到了SOTA水平。通过调整分类阈值,AlphaMissense能够将样本准确地分类为“可能致病”或“可能良性”,其期望精确度均达到了90%
DeepMind表示:
我们期待AlphaMissense能够帮助解决基因组学和生物科学领域中尚未解决的问题
为此,他们已经把AlphaMissense的预测结果和模型代码开源了出来。
DeepMind还分享了一个包含超过19000种人类蛋白质的数据集,其中包含了2.16亿个可能的单氨基酸序列置换预测数据
重写内容,不改变原意,需要改写成中文。不需要出现原句
[1]论文地址:https://www.science.org/doi/10.1126/science.adg7492
需要重写的内容是:[2]https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases
[3]https://github.com/deepmind/alphamissense
— 完—
需要进行改写的内容是:最大的模型 | 专栏文章
如何一键压缩数亿个参数?如何在兼顾大型模型的性能和安全性方面取得平衡?如何通过一行代码来优化和加速模型?本文将介绍关于大型模型的技巧,并手把手教你如何加速大型模型的推理过程!
请点击下方的图片以跳转到专栏文章页面
以上就是《谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源》的详细内容,更多关于的资料请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
430 收藏
-
315 收藏
-
319 收藏
-
170 收藏
-
410 收藏
-
470 收藏
-
196 收藏
-
461 收藏
-
382 收藏
-
332 收藏
-
391 收藏
-
345 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习