Nature子刊:AI算法破解癌细胞基因特征,准确率可达99%!
来源:51CTO.COM
时间:2023-04-28 20:13:38 351浏览 收藏
知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个科技周边开发实战,手把手教大家学习《Nature子刊:AI算法破解癌细胞基因特征,准确率可达99%!》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!
AI又立功了。
这次一项新的AI机器学习算法「Ikarus」,可破解癌细胞和正常细胞的基因特征差别。
这项研究由MDC生物信息学家Altuna Akalin团队完成,并发表在Nature子刊「Genome Biology」上。
论文地址:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-022-02683-1#Sec8
此外,负责本次研究的机构MDC(Max Delbrück center)还是德国四大研究机构之一的亥姆霍兹联合会的16个研究中心之一。
既然这么大来头,那这份研究为啥重磅?
从浩如烟海的数据集里筛选出一种「共通的特征」,人类肯定比不上AI。
而要将癌细胞和正常细胞区分开来,就需要筛选出它们之间的共通特征。
这次MDC的研究团队开发的Ikarus发现了肿瘤细胞中的共通模式(Pattern),它由一系列基因组特征组成,并且常见于各种类型的癌症。
此外,算法还检测到了从未和癌症挂钩的基因种类。
于是研究团队提出了一个简单的问题:
是否有可能制作一个分类器,将肿瘤细胞与多种癌症类型的正常细胞正确区分开来?
于是就有了Ikarus的诞生。它包括两个步骤:
1、通过整合多个经过专业注释的单细胞数据集,以基因集的形式发现全面的肿瘤细胞特征;
2、训练稳健的逻辑回归分类器以严格区分肿瘤和正常细胞,然后使用定制的细胞-细胞网络进行细胞标签的基于网络的传播。
团队负责人Altuna Akalin说:
为开发一种强大、灵敏和可重复的计算机肿瘤细胞分选仪,我们已经在使用不同测序技术获得的各种癌症类型的多个单细胞数据集上测试了Ikarus,以确定它适用于不同实验环境。
惊人的成功率
该论文的第一作者Jan Dohmen表示,在专家已经清楚地区分健康细胞和癌细胞的情况下,获得合适的训练数据是一项重大挑战。
单细胞测序数据集通常很冗杂。
这意味着它们包含的关于单个细胞分子特征的信息不是很精确,因为在每个细胞中检测到不同数量的基因,或者因为样本的处理方式并不总是相同。
Dohmen和该研究的联合负责人Vedran Franke博士说,
我们筛选了无数出版物并联系了相当多的研究小组,以获得足够的数据集。团队最终选择来自肺癌和结直肠癌细胞的数据来训练算法,然后再将其应用于其他类型肿瘤的数据集。
在训练阶段,Ikarus必须找到一个「特征基因列表」,然后将其用于对细胞进行分类。
我们尝试并改进了各种方法,Ikarus最终使用两个列表:一个用于癌症基因,另一个用于来自其他细胞的基因,弗兰克解释道。
经过训练之后,该算法就能够区分其他类型癌症中的健康细胞和肿瘤细胞,例如来自肝癌或神经母细胞瘤患者的组织样本。
而在其他样本中的结果令人雀跃,成功率出奇地高,最高可达99%。
「我们没想到会有一个共同的特征可以如此精确地定义不同类型癌症的肿瘤细胞」,Akalin说。
「但我们仍然不能说这种方法是否适用于所有类型的癌症」,Dohmen补充道。
不只是癌细胞区分
为了将Ikarus变成一种可靠的癌症诊断工具,研究人员现在希望在其他类型的肿瘤上对其进行测试。
在最初的测试中,Ikarus已证明该方法还可以将其他类型(和某些亚型)的细胞与肿瘤细胞区分开来,不仅限于肿瘤细胞检测。
它可用于检测任何细胞状态,例如细胞类型,唯一的要求是细胞状态至少存在于两个独立的实验中。
Akalin说:
我们希望使这种方法更加全面,进一步发展它,以便它可以区分活检中所有可能的细胞类型。
在空间测序数据集上应用自动肿瘤分类可以直接注释组织学样本,从而促进自动化数字病理学。
在医院,病理学家往往只在显微镜下检查肿瘤的组织样本,以识别各种细胞类型。这是一项费时费力的工作。
有了Ikarus,这一步骤有朝一日可能成为一个完全自动化的过程。
此外,Akalin指出,这些数据可用于得出有关肿瘤直接环境的结论。这可以帮助医生选择最好的疗法。对于癌组织和微环境的构成,通常表明某种治疗或药物是否有效。
此外,人工智能也可能有助于开发新的药物。
「Ikarus让我们能够识别出可能导致癌症的基因,然后可以使用新的治疗剂来靶向这些分子结构」Akalin说。
今天关于《Nature子刊:AI算法破解癌细胞基因特征,准确率可达99%!》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
382 收藏
-
332 收藏
-
391 收藏
-
345 收藏
-
250 收藏
-
475 收藏
-
440 收藏
-
142 收藏
-
165 收藏
-
285 收藏
-
369 收藏
-
240 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习