可识别AI生成的科学文本的新型检测工具问世,号称准确率超99%
来源:搜狐
时间:2023-06-19 10:09:42 496浏览 收藏
哈喽!大家好,很高兴又见面了,我是golang学习网的一名作者,今天由我给大家带来一篇《可识别AI生成的科学文本的新型检测工具问世,号称准确率超99%》,本文主要会讲到等等知识点,希望大家一起学习进步,也欢迎大家关注、点赞、收藏、转发! 下面就一起来看看吧!
IT之家 6 月 8 日消息,今年早些时候美国田纳西州健康科学中心的放射学家 Som Biswas 引起关注,因为他在《放射学》杂志上发表了一篇由人工智能聊天机器人 ChatGPT 协助写作的文章,题为《ChatGPT 与医学写作的未来》。他用ChatGPT生成的文本,并进行了编辑,旨在让人们更深刻地理解这项技术的实际应用价值。据他透露,在接下来的四个月内,他使用 ChatGPT 发表了 16 篇期刊文章。一些期刊编辑表示,他们收到了许多用 ChatGPT 撰写的文章。
为了应对这种情况,堪萨斯大学的化学教授 Heather Desaire 和她的团队开发了一种新的 AI 检测工具,可以高效准确地区分科学文本是由人类还是 ChatGPT 生成的,他们的研究结果发表在《细胞报告物理科学》杂志上。
Desaire 教授说,她和她的团队首先分析了 64 篇《科学》杂志上的“观点”文章,这些文章是对当前研究进行评论和评价的综述性文章。接着,他们对 ChatGPT 生成的 128 篇有关相同研究主题的文章进行了分析。他们比较了两者并确定了20个特征,这些特征可以用于辨认科学文本的作者身份。
他们发现,人类科学家和 ChatGPT 在段落复杂度、句子长度、标点符号和词汇使用等方面有明显不同。人类科学家通常更偏爱使用括号、破折号、问号、分号和大写字母,而 ChatGPT 则少用这些符号。“然而”、“尽管”、“但是”等被称为模棱两可的语言,这些语言更受人类科学家青睐。此外,当人类科学家写作时,他们会使用短句和长句,而 ChatGPT 的句子长度则相对平均。
基于这 20 个特征,他们使用了一种现成的机器学习算法 XGBoost 来训练他们的 AI 检测工具,他们测试了他们的 AI 检测工具在 180 篇文章上的表现,发现其非常擅长判断一篇科学文章是由人类还是 ChatGPT 写作的。“这种方法有超过 99% 的准确率”,Desaire 教授说,并补充说这比现有的工具要好得多,因为现有的工具是在更广泛的文本类型上进行训练的,而不是专门针对科学文本的。
Desaire 教授说,这种 AI 检测工具可以帮助期刊编辑处理大量使用 ChatGPT 写作的文章,可以让他们优先考虑哪些文章值得送审。她还说,这种工具可以根据不同的领域进行调整,比如用来检测学生的剽窃行为,只要在适合的语言上进行训练就行。只要你确定有哪些有用的特征,你就能够对它进行改造以应用于你想探究的任何领域。”
不过,IT之家发现并非所有人都对这种AI检测工具的效用看法一致。南澳大利亚大学变化与复杂性学习中心(C3L)的 Vitomir Kovanović博士说,Desaire 教授和她的团队所做的比较是不现实的,因为他们只比较了 100% 由 AI 生成和 100% 由人类生成的文本,而没有考虑到人类和 AI 之间的协作。他说,当科学家使用 ChatGPT 时,往往会有一定程度的人机合作,比如科学家会编辑 AI 生成的文本。重写后的句子:这项措施是必要的,因为 ChatGPT 偶尔会出现错误,甚至生成虚假的参考文献。但是由于研究者只比较了两种极端情况,他们的成功率就被提高了。
阿德莱德大学机器学习研究所的 Lingqiao Liu 博士也认为,在真实世界中,这种 AI 检测工具的准确率可能会降低,导致更多的错误分类。Liu 博士是一位开发算法来检测 AI 生成图像的专家,他说:“从方法论上讲,这没问题,但使用它有一定风险。”
另一方面,Liu 博士指出,人们也有可能指示 ChatGPT 以特定的方式写作,从而让 100% 由 AI 写作的文本通过检测。事实上,一些评论员甚至谈到了一个“军备竞赛”,指的是那些试图让机器更像人类和那些试图揭露那些出于恶意目的使用这项技术的人之间的竞争。
在Kovanović博士看来,这场竞争毫无意义,由于这项技术具有强劲的发展势头和潜在的积极影响。他建议我们将精力集中在如何有效地利用 AI 上,因为他认为目前的 AI 检测还没有抓住重点。他主张不使用反抄袭软件来判断大学生是否使用了AI写作,并认为这会给学生带来无谓的压力。
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
285 收藏
-
364 收藏
-
292 收藏
-
501 收藏
-
169 收藏
-
333 收藏
-
443 收藏
-
196 收藏
-
347 收藏
-
265 收藏
-
457 收藏
-
121 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习