Reddit将向OpenAI等付费以确保用户聊天内容不被滥用
来源:51CTO.COM
时间:2023-04-29 10:56:57 458浏览 收藏
大家好,今天本人给大家带来文章《Reddit将向OpenAI等付费以确保用户聊天内容不被滥用》,文中内容主要涉及到,如果你对科技周边方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!
4月19日消息,微软、谷歌和OpenAI一直在利用Reddit论坛上的用户聊天数据来开发新的人工智能系统。现在,Reddit打算向这些公司收取使用费。
Reddit一直是互联网上热门话题的讨论集中地,每天有大约5700万人访问这个网站讨论各种话题,包括化妆技巧、电子游戏到自动洗车机等等。
近年来,Reddit论坛上的聊天内容已成为谷歌、OpenAI和微软等公司的免费训练工具,用于开发人工智能系统。现在,许多业内人士认为,这些人工智能系统将成为科技行业的下一个大事件。
因此,Reddit打算向开发人工智能技术的公司收费。许多公司都通过应用程序编程接口(API)下载并处理论坛上的聊天内容。周二,Reddit表示计划开始向使用API的公司收费。
Reddit创始人兼首席执行官史蒂夫·霍夫曼(Steve Huffman)在接受采访时表示:“Reddit的数据库确实很有价值,我们没有必要免费提供这些价值给世界上最大的公司。”
Reddit此举是社交网络首次明确向OpenAI等收取费用开放访问权,用于开发像ChatGPT这样的人工智能系统。ChatGPT等新人工智能系统可能有一天会成为大企业,但对Reddit等公司的帮助不大。相反,这些人工智能系统还可以自动生成聊天内容,成为Reddit的竞争对手。
Reddit正在为今年可能上市做准备,该公司成立于2005年,目前主要依赖平台广告和电商交易进行盈利。Reddit方面表示,正在敲定API接口的收费细节,并将在未来几周内公布价格。
如今,大型语言模型已成为开发人工智能新技术的重要组成部分,Reddit论坛上的用户聊天内容也成了有价值的商品。
谷歌人工智能聊天机器人Bard的底层算法之一就是用Reddit聊天数据训练的。同时,OpenAI的ChatGPT也将Reddit的数据作为训练大型语言模型的信息之一。
除此之外,其他公司也开始意识到平台上所存储的聊天内容和图片的价值。图片托管服务Shutterstock已经把图像数据出售给OpenAI,帮助开发了能够根据简单文字提示就能生成图像的人工智能系统DALL-E。
目前,有几千家公司和大小开发者都在使用API跟踪推特平台上的几百万条聊天内容。上个月,个人社交媒体平台推特所有者埃隆·马斯克(Elon Musk)表示,他正在改变使用推特API的现行方式,要为使用API收取几万到几十万不等的费用。不过马斯克没有提到大型语言模型是促使他做出改变的原因。
为了不断改进模型,人工智能企业需要两个重要因素:强大的计算能力和大量可用的数据。一些大型人工智能开发企业通常拥有足够的算力,但仍会在互联网上寻找改进算法所需的数据。其中包括维基百科、各种数字化书籍、学术文章和Reddit论坛上的聊天内容等资源。
谷歌、OpenAI和微软等公司目前尚未对Reddit计划收费的事宜作出回应。
很长一段时间以来,Reddit与谷歌和必应等搜索引擎一直是相互依存的关系。它们自动获取Reddit网页信息,进行索引,然后将相关信息展示在搜索结果页面中。虽然这种自动抓取方式不见得受到所有网站的欢迎,但是Reddit却能因此在搜索结果中排名靠前。
而大型语言模型则完全不同,它需要尽可能多地获取数据,这样才能创建新的人工智能系统。
Reddit认为,它的论坛数据特别有价值,因为它不断更新。霍夫曼表示,这种新鲜度和相关性正是大型语言模型算法生成最佳结果所需要的东西。
“Reddit比互联网上任何其他地方都更适合聊天,”霍夫曼说。“网站上有很多内容是你只会私下里说的,或者压根就不会说的东西。”
霍夫曼还强调,对于想要开发帮助人们使用Reddit的应用程序开发者来说,API仍然是免费的。比如开发者可以免费使用API等工具来开发机器人,自动跟踪用户评论是否遵守了内容发布规则。出于学术研究或非商业目的来研究Reddit数据的人也能继续免费访问这些数据。
Reddit还希望将更多机器学习融入论坛运营,例如,Reddit可以用机器学习来识别平台上人工智能生成文本的使用情况,并为其添加标签,告知用户哪些评论是来自机器人。Reddit还承诺改进供论坛版主使用的软件工具,帮助他们监控论坛上的第三方机器人。
但对于人工智能制造商来说,Reddit认为是时候付费了。
“通过抓取Reddit的数据来创造价值,却不向我们的用户返利,这是我们自己的问题,”霍夫曼说。“现在是我们加强管理的好时机。”(辰辰)
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
344 收藏
-
447 收藏
-
116 收藏
-
373 收藏
-
253 收藏
-
447 收藏
-
340 收藏
-
295 收藏
-
312 收藏
-
485 收藏
-
312 收藏
-
463 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习