Agent重塑大模型,竞争新格局开启
时间:2025-04-13 23:02:02 221浏览 收藏
Agent正重塑大模型竞争格局。随着GPT-4等大模型的迭代更新,依赖工程优化的AI应用逐渐被淘汰,而融合大模型和强化学习的Agent,凭借其独立完成任务的全流程能力,成为新的竞争焦点。 Manus等产品的出现点燃了Agent热潮,但缺乏基础模型和强化学习技术的团队将面临被大模型公司超越的风险。智谱AI推出的AutoGLM“沉思”等国产Agent产品,标志着模型厂商的反击,也预示着Agent竞争将进一步白热化,2025年将是Agent爆发之年。 这其中,拥有强大基座模型和强化学习能力,是Agent成功的关键因素。
两年时间,足以让AI图像生成领域发生翻天覆地的变化。假设两位开发者同时起步,一人专注ComfyUI及相关工作流,另一人则悠闲度日,那么GPT-4o更新后,他们却可能站在同一水平线上。
这正是许多创业者焦虑的根源:持续的努力,是否只是在不断升级的平台上徒劳无功?
基础模型能力的突破,会迅速淘汰那些依赖工程优化作为卖点的应用。尽管“模型无关”的理念存在,但上层应用始终受制于基础大模型。图像生成如此,近期爆火的Agent亦是如此。
Manus的出现,点燃了Agent的热潮,但业内人士普遍认为,缺乏基础模型和强化学习技术的Agent团队,最终将被大模型公司超越。
原因在于:结合大模型和强化学习的Agent,本质上是人工智能时代的“AI个体”,能够独立完成任务理解、推理、决策和执行的全流程。这与以往的AI工具截然不同,后者只能完成单个环节,且需要人工指导。而终极Agent则完全自主,能够独立完成整个工作流程,甚至替代特定工种。
Agent的成功,离不开大模型和强化学习。我们可以将Agent比作“毕业生”:掌握基础模型和强化学习的大模型公司是正规大学;只掌握强化学习的团队是课外辅导班;而两者都不掌握的纯Agent公司,则可能连“入学资格”都没有。
智谱在中关村论坛发布的AutoGLM“沉思”——首个集深度研究和操作能力于一体,并直接上线客户端的Agent产品,印证了这一趋势。这标志着模型厂商的反击,也预示着Agent竞争的进一步白热化。
- 大模型与强化学习:Agent的核心
Agent的未来,归根结底,属于大模型公司。无论是“模型即产品”,还是“产品皆由模型构成”,都无法否认模型与产品密不可分的事实。
Agent的概念源于强化学习,并非大模型的产物。市场上许多产品,只是工作流的堆砌,鱼龙混杂。
真正具有自我学习和决策能力的Agent,其鼻祖可追溯到AlphaGo。不同于“深蓝”等依赖人工规则的传统AI,AlphaGo通过深度神经网络,直接从数据中学习,实现了自我学习,摆脱了对人工经验的依赖。
这种能力迁移的底层逻辑,正是当前大模型Agent的核心目标——在复杂开放环境中自主进化。而强化学习,正是实现这一目标的关键手段。
没有强化学习,就无法构建Agent。OpenAI的Deep Research团队多次强调,基于强化学习的端到端训练是Agent技术革命的核心,因为它解决了传统AI在复杂场景下的灵活性与泛化能力瓶颈。
2023年,文本和多模态大模型能力大幅提升,大模型与强化学习的融合,为Agent带来了新的想象空间:基础模型提供语言理解、任务拆分和推理能力;强化学习则强化Agent在特定领域的专业技能。
一位强化学习研究员将AlphaGo与当前Agent的差异比作:训练单细胞生物(AlphaGo)与训练人类(Agent)。
基座模型赋予Agent通识教育的水平,而强化学习则使其具备职业技能,使其能够胜任实际工作。
2024年,智能体竞争激烈,但直到R1的出现,强化学习地位提升,模型的长链路推理能力增强,OpenAI发布Deep Research、Monica团队发布Manus后,Agent才具备了执行完整工作流程的能力。
OpenAI Deep Research的商业可行性也得到了验证,其月费200美元的定价,体现了其对Agent的自主定价权。而缺乏基础模型的Agent团队,则受制于模型API价格和稳定性。
因此,Agent成为大模型厂商的必争之地,2025年注定是Agent爆发之年。智谱同时掌握模型和产品,能够对Agent进行自主定价。
- 国产大模型的Agent先锋:智谱AI
Agent的关键在于基座模型和强化学习能力。大多数专注Agent的公司缺乏基座模型研发能力,拥有强化学习团队的也寥寥无几。他们只能通过工程优化或差异化定位来争取时间。
但由于缺乏底层模型能力,这种策略只能争取短暂的优势。而能够训练模型的公司,在开发Agent方面往往事半功倍。
智谱AI是国内最早研究和发布Agent产品的团队之一。公开资料显示,智谱清言是国内最早具备Function Call能力的模型产品之一,这为Agent奠定了基础。
智谱AI还率先推出了设备操控智能体AutoGLM,并在Agent Open Day上进行了演示。
此次发布的AutoGLM“沉思”,能够自动完成撰写文章并发送邮件等任务。
国外的通用Agent产品,如Anthropic的computer use和OpenAI的Deep Research、Operator,已经问世。而国内的通用Agent产品相对较少。
AutoGLM“沉思”的主要能力包括:模拟人类思考、感知世界和使用工具。
与OpenAI Deep Research相比,AutoGLM“沉思”除了深度研究能力,还具备操作能力,能够跨多个网站搜索信息,并进行多模态理解。
两者最显著的区别在于价格:Deep Research每月订阅费用为200美元,而AutoGLM“沉思”目前对所有用户免费开放。
智谱AI的模型研发能力有目共睹。AutoGLM“沉思”的所有模型技术均为国产自研,并将于4月14日开源。
- 通往AGI的未来之路
Agent是实现AGI的关键载体。Agent的能力正在逐渐与人类需求接轨,这将创造一个全新的赛道,改变人机交互的形态。
Agent将能够帮助人类完成越来越多的任务,从简单的数字任务到现实世界中的复杂事务。
我们正处于AGI的前夜,Agent将成为人类的数字代理。大模型公司的第二场战斗才刚刚开始,好的Agent产品将成为竞争的关键。智谱AI的先发优势不容忽视。
以上就是《Agent重塑大模型,竞争新格局开启》的详细内容,更多关于的资料请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
181 收藏
-
346 收藏
-
118 收藏
-
350 收藏
-
118 收藏
-
415 收藏
-
358 收藏
-
435 收藏
-
244 收藏
-
430 收藏
-
341 收藏
-
260 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习