构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握
来源:51CTO.COM
时间:2024-03-04 18:18:27 444浏览 收藏
小伙伴们对科技周边编程感兴趣吗?是否正在学习相关知识点?如果是,那么本文《构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握》,就很适合你,本篇文章讲解的知识点主要包括。在之后的文章中也会多多分享相关知识点,希望对大家的知识积累有所帮助!
浏览我们的指南,掌握如何让您的企业充分利用人工智能技术。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程等内容,这对那些希望负责任地应用人工智能的企业来说非常有益。
为企业打造AI-Ready平台
企业在引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这些风险通常是相互关联的,范围从导致合规问题的潜在偏见到缺乏领域知识。主要问题包括声誉损害、遵守法律和监管标准(尤其是与客户互动有关)、知识产权侵权、道德问题和隐私问题(尤其是在处理个人或可识别数据时)。
为了应对这些挑战,提议采用检索增强生成(RAG)等混合策略。RAG技术能够提高人工智能生成内容的质量,使企业人工智能计划更为安全可靠。这一策略能够有效解决知识缺失和错误信息等问题,同时也确保遵守法律和道德准则,防止声誉受损和违规行为的发生。
了解检索增强生成 (RAG)
检索增强生成(RAG)是一种先进方法,通过集成企业知识库中的信息来提高人工智能内容创建的准确性和可靠性。将 RAG 视为一位大厨,他依靠与生俱来的天赋、全面的培训和创意天赋,所有这些都得到了对烹饪基础知识的透彻理解的支持。当需要使用不寻常的香料或满足对新颖菜肴的要求时,厨师会查阅可靠的烹饪参考资料,以确保成分得到最佳利用。
就像一名大厨可以烹饪出多样的美食一样,GPT和LLaMA-2等人工智能系统也能生成各种主题的内容。然而,当需要提供详细准确的信息时,尤其是在处理新颖的美食或浏览大量企业数据时,它们会借助特殊工具来确保信息的准确性和深度。

如果 RAG 的检索阶段不充分怎么办?

CRAG是一种纠正性干预,旨在加强RAG设置的稳定性。CRAG利用T5来评估检索到的文档的相关性。当企业来源的文档被视为不相关时,可能会通过网络搜索来填补信息空白。
企业级生成人工智能解决方案的架构注意事项
架构从根本上是围绕三个核心支柱构建的:数据摄入、查询和智能检索、生成提示工程和大语言模型。
数据摄入:第一步是将公司文档的内容转换为易于查询的格式。此转换是使用嵌入模型完成的,遵循以下操作序列
- 数据分段:来自企业知识源(例如 Confluence、Jira 和 PDF)的各种文档被提取到系统中。此步骤涉及将文档分解为可管理的部分,通常称为“块”。
- 嵌入模型:然后将这些文档块传递给嵌入模型。嵌入模型是一种神经网络,它将文本转换为表示文本语义的数字形式(向量),使其能够被机器理解。
- 索引块:然后对嵌入模型产生的向量进行索引。索引是以有利于高效检索的方式组织数据的过程。
- 矢量数据库:将所有矢量嵌入保存在矢量数据库中。并将每个嵌入表示的文本保存在不同的文件中,确保包含对相应嵌入的引用。
查询和智能检索:推理服务器收到用户的问题后,就会通过嵌入过程将其转换为向量,该过程使用相同的模型在知识库中嵌入文档。然后,向量数据库进行搜索,以识别与用户意图密切相关的向量,并将其提供给大型语言模型 (LLM) 以丰富上下文。
5.查询:从应用程序和API层进行查询。该查询是用户或其他应用程序在搜索信息时输入的内容。
6.嵌入查询检索:利用生成的 Vector.Embedding 在矢量数据库的索引中开始搜索。选择您想要从矢量数据库中检索的矢量数量;这个数字将与您计划编译和用于解决问题的上下文数量成正比。
7.向量(相似向量):该过程识别相似向量,这些向量表示与查询上下文相关的文档块。
8.检索相关向量:
从向量数据库中检索相关向量。例如,在厨师的背景下,它可能相当于两个相关向量:食谱和准备步骤。相应的片段将被收集并随提示一起提供。
9.检索相关块:系统获取与被识别为与查询相关的向量相匹配的文档部分。一旦评估了信息的相关性,系统就会确定后续步骤。如果信息完全一致,它会根据重要性进行排列。如果信息不正确,系统会将其丢弃并在线查找更好的信息。
生成提示工程和LLMs:生成提示工程对于指导大型语言模型给出正确答案至关重要。它涉及创建考虑到任何数据差距的清晰而精确的问题。这个过程是持续进行的,需要定期调整以获得更好的响应。确保这些问题合乎道德、没有偏见并避免敏感话题也很重要。
10. 提示工程:然后将检索到的块与原始查询一起使用以创建提示。该提示旨在有效地将查询上下文传达给语言模型。
11. LLM(大型语言模型):工程提示由大型语言模型处理。这些模型可以根据收到的输入生成类似人类的文本。
12. 答案:最后,语言模型使用提示提供的上下文和检索到的块来生成查询的答案。然后,该答案通过应用程序和 API 层发送回用户。
结论
本博客探讨了将人工智能集成到软件开发中的复杂过程,强调了受 CRAG 启发建立企业生成人工智能平台的变革潜力。通过解决即时工程、数据管理和创新检索增强生成 (RAG) 方法的复杂性,我们概述了将人工智能技术纳入业务运营核心的方法。未来的讨论将进一步深入探讨智能开发的生成式人工智能框架,研究最大限度地利用人工智能的具体工具、技术和策略,确保更智能、更高效的开发环境。
作者 | Venkat Rangasamy
今天关于《构建企业级人工智能平台:利用RAG和CRAG实现商业人工智能的掌握》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
367 收藏
-
453 收藏
-
222 收藏
-
159 收藏
-
154 收藏
-
247 收藏
-
312 收藏
-
132 收藏
-
304 收藏
-
328 收藏
-
345 收藏
-
480 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习