登录
首页 >  科技周边 >  人工智能

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

来源:搜狐

时间:2023-09-21 14:10:11 220浏览 收藏

科技周边小白一枚,正在不断学习积累知识,现将学习到的知识记录一下,也是将我的所得分享给大家!而今天这篇文章《谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源》带大家来了解一下##content_title##,希望对大家的知识积累有所帮助,从而弥补自己的不足,助力实战开发!


需要重新书写的内容是:鱼羊发自凹非寺

量子位 | 公众号 QbitAI

基因突变会如何影响人类健康,很大程度上还是个未解之谜。

不过现在,人类可以借AI之力来研究这件事儿了:

谷歌DeepMind在AlphaFold的基础上,训练出了专门预测人类基因组中错义突变致病性AlphaMissense

今天,一篇论文被发表在《科学》杂志上

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

“错义突变”是DNA序列的一种非同义替换。简单来说,就是DNA原本的字母(碱基对)被替换掉了。

这就意味着,对应生成的蛋白质里的氨基酸也会发生异化,这可能会让蛋白质失去原本的功能,导致疾病的产生。

AlphaMissense出山第一步,就是对全部7100万种可能的错义突变进行了分类。

AI成功将这些变异中的89%准确分类为“可能致病”和“可能良性”。与此相比,人类专家目前的准确率仅为0.1%

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

使用人工智能来预测基因突变的致病性

一句话总结,AlphaMissense的主要能力,就是预测人类基因组中所有可能的错义突变是致病性的还是良性的。

如何实现——

AlphaMissense基于DeepMind的蛋白质结构预测模型AlphaFold打造。

研究人员对AlphaFold进行了微调,使用了人类和灵长类变异频率数据库。具体来说,常见的自然界变异被视为对生物无害的变异,而数据库中未出现的变异则被视为“致病变异”训练数据

这种训练策略,可以避免人工标注带来的偏见。

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

需要重新写的内容是:AlphaMissense无法预测突变后蛋白质结构的变化以及突变对蛋白质稳定性的其他影响

AlphaMissense在输入一种错义突变后,会结合蛋白质的结构上下文和蛋白质语言模型,对突变进行一个0-1分的评分,以此大致判断这种突变是否会导致疾病

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

AlphaMissense+AlphaFold效果

那么问题来了,AlphaMissense的这种分类,真的可靠吗?

经过实验验证,研究人员对此进行了验证

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

在遗传学权威数据库ClinVar中,AlphaMissense显示出比其他计算方法更强大的分类性能

在18924个变异数据中,AlphaMissense的ROC曲线下面积(auROC)为0.94。这个数字越接近于1,就意味着模型越能够准确地区分正样本和负样本

值得注意的是,上图中,以灰色显示的计算方法是在ClinVar上训练的,可能存在过拟合。

AlphaMissense在预测准确率方面也达到了SOTA水平。通过调整分类阈值,AlphaMissense能够将样本准确地分类为“可能致病”或“可能良性”,其期望精确度均达到了90%

谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源

DeepMind表示:

我们期待AlphaMissense能够帮助解决基因组学和生物科学领域中尚未解决的问题

为此,他们已经把AlphaMissense的预测结果和模型代码开源了出来。

DeepMind还分享了一个包含超过19000种人类蛋白质的数据集,其中包含了2.16亿个可能的单氨基酸序列置换预测数据

重写内容,不改变原意,需要改写成中文。不需要出现原句

[1]论文地址:https://www.science.org/doi/10.1126/science.adg7492

需要重写的内容是:[2]https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases

[3]https://github.com/deepmind/alphamissense

需要进行改写的内容是:最大的模型 | 专栏文章

如何一键压缩数亿个参数?如何在兼顾大型模型的性能和安全性方面取得平衡?如何通过一行代码来优化和加速模型?本文将介绍关于大型模型的技巧,并手把手教你如何加速大型模型的推理过程!

请点击下方的图片以跳转到专栏文章页面

以上就是《谷歌DeepMind再登Science:用AI预测基因突变致病性,PK人类专家=89:0.1 | 开源》的详细内容,更多关于的资料请关注golang学习网公众号!

声明:本文转载于:搜狐 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>