登录
首页 >  科技周边 >  人工智能

量化617,462种人类微蛋白必需性,北大LLM蛋白质综合预测与分析,登Nature子刊

时间:2024-12-10 20:55:02 103浏览 收藏

在科技周边实战开发的过程中,我们经常会遇到一些这样那样的问题,然后要卡好半天,等问题解决了才发现原来一些细节知识点还是没有掌握好。今天golang学习网就整理分享《量化617,462种人类微蛋白必需性,北大LLM蛋白质综合预测与分析,登Nature子刊》,聊聊,希望可以帮助到正在努力赚钱的你。

北京大学研究团队利用预训练蛋白质语言模型,开发出一种名为蛋白质重要性计算器(PIC)的深度学习模型,用于预测人类必需蛋白(HEP)。该模型克服了传统实验方法成本高、耗时长的缺点,并能更准确地预测不同层次(人类个体、细胞系、小鼠模型)的HEP。

PIC模型在预测HEP方面表现优异,其准确性显著超过现有方法。研究人员通过微调预训练语言模型(PLM),构建了包含人类水平(PIC-human)、小鼠水平(PIC-mouse)和323个细胞系水平(PIC-cell)模型的PIC模型系列。 每个PIC模型都由嵌入、注意力和预测三个模块组成,并通过集成学习方法整合结果,提高预测精度。消融实验和超参数优化确保了模型的最佳性能。

在多个指标(AUC-ROC, AUC-PRC, 准确率,召回率,精确率,F1分数)上,PIC模型均展现出显著优势,与现有模型相比,AUC-ROC提升了5.13%-12.10%。 研究团队还利用PIC模型定义了蛋白质必需评分(PES),并通过生物学分析验证了其有效性,例如在乳腺癌预后生物标志物识别和617,462种人类微蛋白必需性量化方面展现了其生物医学价值。

这项研究发表在《Nature Computational Science》杂志上,其成果为全面预测和理解人类蛋白质必需性提供了强有力的工具,并为疾病治疗靶点和预后生物标志物的发现提供了新的途径。 PIC模型还具有可扩展性,未来研究方向包括提升PES的可解释性、扩展至其他物种,以及整合蛋白质结构信息以进一步提高预测精度。 研究团队已开放PIC服务器(http://www.cuilab.cn/pic),方便研究人员使用。 论文链接:https://www.nature.com/articles/s43588-024-00733-1

到这里,我们也就讲完了《量化617,462种人类微蛋白必需性,北大LLM蛋白质综合预测与分析,登Nature子刊》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于语言模型,蛋白质,理论,北京大学的知识点!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>