登录
首页 >  科技周边 >  人工智能

谷歌发布了具备自我判断输出正确性能力的 AI 训练框架 ASPIRE

来源:51CTO.COM

时间:2024-02-07 22:44:58 423浏览 收藏

一分耕耘,一分收获!既然打开了这篇文章《谷歌发布了具备自我判断输出正确性能力的 AI 训练框架 ASPIRE》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

谷歌近日发布新闻稿,宣布推出ASPIRE训练框架,专为大语言模型设计。该框架旨在提升AI模型的选择性预测能力。

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能,因此谷歌开发了一款 ASPIRE 训练框架,为系列模型引入了“可信度”机制,即 —— 模型会输出一系列答案,每个答案都会具有正确概率评分

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

▲ 图源 谷歌新闻稿(下同)

在技术层面,该训练框架可划分为三个阶段:特定任务调整、答案采样和自我评估学习。

其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练,专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数,在特定任务的训练数据集上微调预训练语言模型,从而提升模型预测性能,让模型能够更好地解决特定问题。

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

第二阶段为“答案采样”,经过特定微调后,模型可以利用先前学习到的可调参数,为每个训练问题生成不同的答案,并创建用于自我评估学习的数据集,生成一系列可信度较高的答案。研究人员同时使用 “集束搜索(Beam Search)”方法及 Rouge-L 算法来评估答案的质量,并将生成的答案及评分重新输入给模型开启第三阶段

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

而在第三阶段“自我评估学习”中,研究人员为模型添加一组可调参数,专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”,从而让大语言模型在生成答案时,还会附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果,据称“经过 ASPIRE 调整的 OPT-2.7B 小模型,表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明,只要经过适当的调整,即使是小语言模型,在部分场景下也可以超越大语言模型。

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

研究人员总结称,ASPIRE 框架训练能够显著提升大语言模型输出准确率,即使是较小的模型,也可以在经过微调后进行“准确且有自信”的预测

到这里,我们也就讲完了《谷歌发布了具备自我判断输出正确性能力的 AI 训练框架 ASPIRE》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于AI,​谷歌,大语言模型的知识点!

声明:本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>