智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%
来源:51CTO.COM
时间:2024-04-14 16:54:11 459浏览 收藏
知识点掌握了,还需要不断练习才能熟练运用。下面golang学习网给大家带来一个科技周边开发实战,手把手教大家学习《智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%》,在实现功能的过程中也带大家重新温习相关知识点,温故而知新,回头看看说不定又有不一样的感悟!
在大数据时代,数据科学覆盖了从数据中挖掘见解的全周期,包括数据收集、处理、建模、预测等关键环节。鉴于数据科学项目的复杂本质以及对人类专家知识的深度依赖,自动化在改变数据科学范式方面拥有极大的发展空间。随着生成式预训练语言模型的兴起,让大语言模型智能体处理复杂任务变得越来越重要。
传统的数据处理和分析通常需要依赖专业数据科学家进行,这既费时又费力。但如果我们能够利用大型语言模型智能体来扮演数据科学家的角色,那将为我们带来更高效的洞察和分析,同时也可能开启前所未有的工业模式和研究范式。
这样一来只要给定数据任务需求,专注于数据科学的智能体就可以自主地处理海量数据,发现隐藏在数据背后的模式和趋势。更广阔地,可以提供清晰模型构建的策略和代码,调用机器进行模型部署推理,最后利用数据可视化,使复杂的数据关系一目了然。
近期,吉林大学、上海交通大学和伦敦大学学院汪军团队合作提出了 DS-Agent,这一智能体的角色定位是一名数据科学家,其目标是在自动化数据科学中处理复杂的机器学习建模任务。技术层面上,团队采用了一种经典的人工智能策略 —— 基于案例的推理(Case-Based Reasoning,CBR),赋予了智能体 “参考” 他山之石的能力,使其能够利用以往解决类似问题的经验来解决新问题。
- 论文链接:https://arxiv.org/pdf/2402.17453.pdf
- 代码链接:https://github.com/guosyjlu/DS-Agent
- 论文题目:DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning
研究背景
在自动化数据科学这种开放决策场景中,目前的大模型智能体(例如 AutoGPT、LangChain、ResearchAgent 等)即使搭配 GPT-4 也难以保证较高的成功率。其主要挑战在于大模型智能体无法稳定地生成可靠的机器学习解决方案,并且还面临着幻觉输出的问题。当然,针对数据科学这一特定场景对大模型进行微调似乎是一种可行的策略,但这同时引入了两个新问题:(1)生成有效的反馈信号需要基于机器学习模型训练,这一过程需要耗费大量时间才能积累足够的微调数据。(2)微调过程中需要执行反向传播算法,这不仅增加了计算开销,而且大幅度提升了对计算资源的需求。
在这种情况下,团队决定利用 Kaggle 这一重要资源。Kaggle 是全球最大的数据科学竞赛平台,汇聚了来自经验丰富的数据科学家社区的大量技术报告和代码。为了让大型智能体能够充分利用这些专业知识,团队采用了一种经典的人工智能问题解决方法 —— 基于案例的推理。
案例推理的核心机制是建立和维护案例库,用于存储过往的经验。当遇到新问题时,系统会检索案例库中与之相似的案例,并尝试借鉴这些案例的解决方案。随后,系统会评估解决方案的有效性,并根据反馈对其进行修订。成功的解决方案会被记录在案例库中,以备将来参考和复用。
团队提出 DS-Agent,利用 CBR 技术,使大型智能体能够分析、提取和应用 Kaggle 上的人类专家见解。通过实际执行反馈,不断迭代和修订解决方案,从而持续提升面向数据科学任务的性能。
框架细节
总体上,DS-Agent 实现了两种模式,以适应不同的应用阶段和资源要求。
- 标准模式(开发阶段):DS-Agent 采用 CBR 构建自动化迭代流程,这模拟了数据科学家在搭建和调整机器学习模型时的连续探索过程,通过不断的实验和优化以求达到最佳解决方案。
- 低资源模式(部署阶段):DS-Agent 复用开发阶段积累的成功案例来生成代码,这大大减少了对计算资源和基座模型推理能力的需求,使得开源大模型解决自动化数据科学任务成为可能。
开发阶段中,给定一个新的数据科学任务,DS-Agent 首先从 Kaggle 中检索出与任务相关的人类专家知识,并在此基础上构建初步的解决方案。紧接着,它进入一个迭代循环,通过编程和调试来训练机器学习模型,以获得在测试集上的性能指标。这些反馈指标成为评价和改进解决方案的关键依据。DS-Agent 会根据这些指标对模型设计进行必要的修改,以寻求最优的模型设计。在这个过程中,那些最优的机器学习解决方案被保存在案例库中,为将来遇到类似任务时提供了参考。
部署阶段下,DS-Agent 的工作模式变得更加直接和高效。在这个阶段,它直接检索并复用经过验证的成功案例来生成代码,而无需再次从头开始探索。这样不仅降低了对计算资源的需求,使得 DS-Agent 能够快速响应用户的需求;还显著降低了对大模型基座能力的要求,以一种低资源的方式提供高质量的机器学习模型。
实验设置
我们收集了 30 种不同的数据科学任务,覆盖了三种主要数据模态(文本、表格和时间序列)以及两大机器学习核心问题(分类和回归),并设计了不同的评价指标来保证任务的多样性。
开发阶段实验结果
在开发阶段中,DS-Agent 使用 GPT-4 首次在数据科学任务中实现了 100% 的成功率;相比之下,DS-Agent 即使使用 GPT-3.5 也展现出了比最强基线 ResearchAgent 使用 GPT-4 时还要更高的成功率。
此外,DS-Agent 使用 GPT-4 和 GPT-3.5 时,分别在测试集评价指标中取得了第一和第二的成绩,显著优于最强基线 ResearchAgent。
部署阶段实验结果
部署阶段中,DS-Agent 使用 GPT-4 时,取得了首次接近 100% 的一次成功率,同时将开源模型 Mixtral-8x7b-Instruct 的一次成功率从 6.11% 跃升到了 31.11%。
在测试集指标评估中,DS-Agent 使用 GPT-4 和 GPT-3 时,取得了第一和第二的成绩;然而遗憾的是,开源大模型 Mixtral-8x7b-Instruct 在 DS-Agent 的加持下仍然没有超越 GPT-3.5。
最后,我们对 DS-Agent 在两种不同模式下的 API 调用成本进行了分析。通过对比,我们发现在开发阶段,DS-Agent 分别对 GPT-4 和 GPT-3.5 进行调用时,单次成本分别是 1.60 美元和 0.06 美元。然而,在部署阶段,成本得到了显著降低:DS-Agent 单次使用 GPT-4 的成本下降至仅需 13 美分,而单次使用 GPT-3.5 的成本更是低至不足 1 美分。这意味着在部署阶段,与开发阶段相比,我们实现了超过 90% 的成本节省。
借助 DS-Agent,即便你不懂编程、没学过机器学习,也能轻松应对各种复杂的数据分析挑战,瞬间获得深入的业务洞察,进行有效的决策支持,优化策略,并预测未来趋势,从而使企业数据部门的工作效率有望得到大幅提升。试想一下,营销人员只需用自然语言描述需求,智能体就能快速生成用户画像和营销策略分析;金融分析师告别手动建模的繁琐,转而与智能体探讨市场趋势…… 这一切可能很快就会成为现实。当然,自动化数据科学还处于起步阶段,离规模化应用尚需时日。但 DS-Agent 的出现无疑为我们展现了一幅令人期待的未来图景。随着人工智能的不断发展,冗杂的数据分析工作有朝一日或将被 AI 接管,而人类则可以把更多时间放在洞见思考和创新决策之上。
以上就是《智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%》的详细内容,更多关于自动化,智能体的资料请关注golang学习网公众号!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
361 收藏
-
272 收藏
-
248 收藏
-
335 收藏
-
480 收藏
-
135 收藏
-
406 收藏
-
454 收藏
-
284 收藏
-
226 收藏
-
447 收藏
-
301 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习