登录
首页 >  科技周边 >  人工智能

DeepSeek携手清华,AI模型效率大提升

时间:2025-04-23 10:49:45 220浏览 收藏

DeepSeek与清华大学合作,致力于降低人工智能(AI)模型训练成本,减少运营支出。DeepSeek发布的低成本推理模型引发业界关注,并与北京大学合作,提出一种全新的强化学习方法,显著提升模型效率。通过奖励更准确、更易理解的响应,该方法引导AI模型更好地满足用户需求。DeepSeek团队运用“自我原则批评调整”方法,解决了将强化学习推广至更广泛应用的挑战,推出了名为DeepSeek-GRM的通用奖励模型,并计划开源发布。

DeepSeek联合清华大学发表论文 旨在提高AI模型效率

DeepSeek携手清华大学,致力于降低人工智能(AI)模型训练成本,从而减少运营支出。

DeepSeek 一月份发布的低成本推理模型引发业界关注。该公司与北京大学研究人员合作,发表论文阐述了一种全新的强化学习方法,显著提升模型效率。

该方法通过奖励更准确、更易理解的响应,引导AI模型更好地满足用户需求。强化学习在特定应用和领域的人工智能任务中展现出加速效果,但将其推广至更广泛应用却面临挑战。DeepSeek团队运用“自我原则批评调整”方法解决了这一难题。论文显示,此策略在各项基准测试中均优于现有方法和模型,在计算资源更少的情况下实现了更优性能。

DeepSeek 将这些新模型命名为 DeepSeek-GRM(通用奖励模型),并计划开源发布。阿里巴巴、OpenAI等其他AI开发商也正积极探索提升AI模型实时执行任务的推理和自我学习能力。

以上就是《DeepSeek携手清华,AI模型效率大提升》的详细内容,更多关于强化学习,DeepSeek,低成本推理模型,通用奖励模型,自我原则批评调整的资料请关注golang学习网公众号!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>