早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL
来源:机器之心
时间:2024-07-17 20:45:58 389浏览 收藏
怎么入门科技周边编程?需要学习哪些知识点?这是新手们刚接触编程时常见的问题;下面golang学习网就来给大家整理分享一些知识点,希望能够给初学者一些帮助。本篇文章就来介绍《早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL》,涉及到,有需要的可以收藏一下
arXiv 不是同行评审期刊,所以发在 arXiv 上的论文不必被引用,这合理吗?
如果你对 AI 智能体感兴趣,那你一定知道微软的 AutoGen。它是一个用于构建 AI 智能体的开源编程框架,允许多个智能体通过聊天来解决任务。其间,LLM 智能体可以扮演多种角色,如程序员、设计师,或者各种角色的组合。
在 GitHub 上,这个项目已经收获了 28k 的 star 量,论文还在 ICLR 2024 LLM Agent Workshop 上获得了最佳论文奖。
不过,这篇论文的背后其实是存在争议的。
2023 年 11 月,一位 AI 研究者(阿卜杜拉国王科技大学博士,开源项目 Camel-AI.org、DeepGCNs.org 的发起人李国豪)发帖称,由于 AutoGen 与他们的论文 CAMEL 高度相似,他们每次出席活动的时候都会被问,二者有什么区别?
对此,李国豪表示非常无奈,因为他们的论文发布在 arXiv 上的时间要明显早于 AutoGen,如今却被当成了 AutoGen 的模仿者(CAMEL 发布于 2023 年 3 月;AutoGen 发布于 2023 年 8 月)。
论文链接:https://arxiv.org/abs/2303.17760
论文链接:https://arxiv.org/pdf/2308.08155
根据李国豪的说法,二者在方法论上存在以下相似之处:
甚至用到的例子也有点相似:
作为后来者,AutoGen 确实在论文中提到过 CAMEL,并指出了 CAMEL 与 AutoGen 之间的一些差异。但这些内容出现的位置令人费解 —— 它们统统出现在附录中。这可能也是导致其他研究者只知 AutoGen,不知 CAMEL 的一大原因。毕竟,有几个人会去仔细看附录呢?
AutoGen 论文中提及 CAMEL 的段落:「CAMEL(Li et al., 2023b)是一个通信智能体框架,它展示了如何使用角色扮演来让聊天智能体相互交流以完成任务。CAMEL 还能记录智能体对话以进行行为分析和能力理解。CAMEL 使用了一种「inception-prompting」技术实现智能体之间的自主合作。与 AutoGen 不同的是,CAMEL 本身不支持工具使用(如代码执行)。尽管 CAMEL 被提议作为多智能体对话的基础设施,但它只支持静态对话模式,而 AutoGen 还支持动态对话模式。」
表 1 为 AutoGen 与其他相关多智能体之间的差异总结,从四个指标着手判断:一是基础结构,即系统是否设计为构建 LLM 应用程序的通用基础结构;二是对话模式,即系统支持的模式类型。在「静态」模式下,无论输入如何,智能体拓扑结构都保持不变。AutoGen 允许灵活的对话模式,包括可以根据不同应用程序需求定制的静态和动态模式。三是可执行,即系统是否可以执行 LLM 生成的代码;四是人工参与,系统是否(以及如何)允许人工参与执行过程。AutoGen 允许人工灵活地参与多智能体对话,并允许人工选择跳过提供输入。
AutoGen 论文中提及 CAMEL 的段落:「AutoGen 可以帮助开发能力超强的智能体,充分利用 LLM、工具和人类的优势。创建这样的智能体对于确保多智能体工作流能够有效地排除故障并在任务中取得进展至关重要。例如,我们观察到,另一个多智能体 LLM 系统 CAMEL 在大多数情况下无法有效解决问题,主要是因为它缺乏执行工具或代码的能力。这一失败表明,仅有简单角色扮演的 LLM 和多智能体对话是不够的,还必须有具备各种技能的高级能力智能体。我们认为,开展更系统的工作,制定针对特定应用的智能体指南,创建大型 OSS 知识库,并创建能够发现和提升自身技能的智能体是必要的。
在 AutoGen 提交给 ICLR 主会议审稿期间,CAMEL 一作李国豪在公共评论区指出了这一问题,并强调这是「值得注意的遗漏」。
在针对 AutoGen 的审稿意见中,ICLR 的审稿人和领域主席也指出了这种做法的不妥之处。
其中,领域主席写道,「作者确实在附录中讨论了这一工作,但这种做法是不可取的,因为补充材料的审核级别与论文的审核级别不同。简而言之,这似乎允许作者说他们引用和讨论了论文,但实际上并没有在 99% 的人可能阅读的论文部分进行引用和讨论。我认为这种做法令人担忧。」
那 AutoGen 的作者为什么这么做呢?他们回复说:在他们将论文提交给 ICLR 2024 时,CAMEL 等论文尚未在同行评审会议 / 期刊上发表。根据 ICLR 2024 审稿人指南,他们没有义务引用这篇论文或与之比较(CAMEL 于 2023 年 9 月被 NeurIPS 2023 录用;ICLR 2024 审稿人指南规定,在 2023 年 5 月 28 日之后发表的论文不需要引用)。
同时,他们列出了论文中涉及 CAMEL 的部分:
鉴于 ICLR 规定在先,领域主席也不好多说什么。他写道,「虽然我理解这项政策背后的基本原理,但在当前的出版氛围下,它可能会导致奇怪的结果。由于 ICLR 的政策,我不会将其纳入我的决定中,但这会降低我的信心。」
关于李国豪提及的相似性,AutoGen 作者也给出了反驳意见:
针对审稿人提出的问题,他们回复如下:
最终,和 CAMEL 之间的相似性以及引用问题并未作为论文的主要问题被领域主席考虑在内。不过,AutoGen 论文最终还是因为其他原因被拒(所以后来作者转投了 ICLR 2024 LLM Agent Workshop)。
根据李国豪的说法,两篇论文的作者其实在线下见过面,但发生了一些不愉快:
李国豪希望能够通过发帖引起学术界的重视。
对此,你怎么看呢?
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
345 收藏
-
258 收藏
-
372 收藏
-
328 收藏
-
360 收藏
-
497 收藏
-
125 收藏
-
229 收藏
-
393 收藏
-
464 收藏
-
155 收藏
-
282 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习