知识库存储“催产”大模型应用:AI新新人类的时间开始了
来源:搜狐
时间:2023-09-24 08:11:02 358浏览 收藏
一分耕耘,一分收获!既然打开了这篇文章《知识库存储“催产”大模型应用:AI新新人类的时间开始了》,就坚持看下去吧!文中内容包含等等知识点...希望你能在阅读本文后,能真真实实学到知识或者帮你解决心中的疑惑,也欢迎大佬或者新人朋友们多留言评论,多给建议!谢谢!
在一个深处的森林里,有一棵已经存在了一千年的老柯树。据传说,只要孩子们沉入它的树洞中的梦境,他们就能实现任何愿望……这个奇幻的场景是大江健三郎在他的著作《两百年的孩子》中描绘的,并且这也是他向之前的作品《给新新人类》致敬的方式
关于“新新人类”,最早的说法源自一则开喜乌龙茶的广告创意,而大江健三郎讲述的故事显然更具隐喻意味——那棵古树代表了千年文明的知识积累,孩子则是每个时代都可能催生的“新新人类”,只不过“树洞”在不同时期表现形式千差万别。
大模型时代的“树洞”在哪里呢?“新新人类”又会以怎样的面貌呈现?在华为全联接大会2023期间,华为联合紫东太初、智谱AI、讯飞医疗、宇树科技等伙伴发布智能数字人、智能编程助手、智能医疗助手、智能巡检机器人,打造“AI新新人类”,加速场景化大模型商用落地
重写后的内容:当大型模型的开发和应用遇到瓶颈时,基于知识库的新型存储产品成为了突破困境、孕育奇迹的"树洞"。由此诞生的"AI新新人类"将成为新时代的潮流引领者。有趣的是,旧人类、新人类和"AI新新人类"的故事才刚刚开始
大模型时代堪称新生物种的“寒武纪”
从5亿3000万年前起,大约在2000多万年时间内,门类众多的无脊椎动物化石突然出现,但在早期更为古老的地层中,却至今没有找到其祖先化石——这就是著名的“寒武纪生命大爆发”。
今年初开始的AIGC风潮,使得人工智能进入了大模型时代,预计会出现前所未有的新生物种。然而,大模型在开发和运作过程中面临着许多挑战,这在一定程度上阻碍了应用的实际推广
首先,数据准备时间长,数据来源分散且归集慢,预处理百TB数据需10天左右。其次,多模态大模型以海量文本、图片为训练集,当前海量小文件的加载速度不足100MB/s。再次,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,故障恢复耗时超过1天。最后,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%
就像“寒武纪生命大爆发”需要地球的温度、湿度、含氧量等都达到适宜新物种诞生的水平,大模型时代同样要改变基础的环境要素,才能加快场景化落地的步伐。打造大模型时代的AI存储新品,正是直面痛点的应时之举。
今年7月,华为重磅推出FusionCube A3000 训/推超融合一体机,集高性能存储节点、训推节点、网络设备、AI平台软件于一体,客户可以一站式部署,开箱即用,大幅降低AI大模型的前期使用、部署门槛与成本投入。
华为目前已经与多家合作伙伴展开合作,并在存储新产品方面取得了实质性的成果展示。通过大规模生成“AI新新人类”场景化大模型,华为在商用领域树立了新的标杆。在知识库存储的推动下,将会有更多的AI机器人和全新的物种健康成长
AI新新人类迈向加速进化期
华为公司副总裁、数据存储产品线总裁周跃峰博士指出,历经千年的文明孕育了千行万业,并在历史的积淀中形成了大量的知识库。在人工智能大模型的时代,只有将这些知识库赋予大模型,机器人的智能才能够进行“思考”,从而进化出适用于各种场景的全新人工智能
华为公司副总裁、数据存储产品线总裁周跃峰博士
如果说数据决定人工智能的高度,那么知识库则是人工智能新人类成长的阶梯。华为存储以数据为基础,将行业专有知识库与强大的模型能力充分结合,与合作伙伴共同推动人工智能新人类的不断进化
在AI新新人类的大家族中,智能数字人也许是“最靓的仔”。紫东太初基于训/推超融合一体机、紫东太初大模型和智能数字人知识库,推出存储智能小海、政务前台、办税助理等智能数字人。其中,存储智能小海是华为数据存储产品线的第一名数字员工,将为华为销售人员和商业市场伙伴提供售前技术咨询,具备智能问答、意图查询、内容生成等功能。
根据相关统计数据显示,中国的数字人领域正在迅猛发展,预计到2026年,整个市场规模将达到1024亿元。然而,新兴的数字人赛道也面临着一些成长的困扰。例如,面向不同行业的多模型应用落地时,传统的交付方式通常涉及多个硬件的拼装,这导致设备交付困难、数据容易泄露、定制方式复杂以及运行容易中断等问题
针对上述难题,双方联合打造的训/推超融合一体机内置华为硬件、容器平台和紫东太初全链路工具链,实现一柜软硬件全集成。从设备组装、部署到训推、运维,紫东太初和华为提供全流程的工具和软件,最终达成智能数字人上线时间缩短到2天、开发周期缩短到7天。
在AI新新人类最容易切入的“工种”中,编程应该是典型代表。智谱AI基于华为FusionCube A3000训/推超融合一体机、智谱CodeGeeX 编程大模型以及企业业务代码知识库,打造智能编程助手,实现智能问答、代码生成与补全、测试用例生成、代码优化、自动添加注释、代码翻译等功能,可通过语义分析和查询技术检测代码中的漏洞和缺陷,让程序员尽享编程乐趣。
从场景适宜度的角度看,医疗行业也是AI新新人类施展身手的大舞台。华为与讯飞医疗共同打造智能医疗助手,其基于华为FusionCube A3000训/推超融合一体机、讯飞星火大模型和医疗知识库,实现语音病历、会诊助手、智能查房、智能随访等功能,让每个患者都有一个AI健康助手,每个医生都有一个AI诊疗助理。
除了锦上添花,AI新新人类还能在充满风险和不确定性的场景雪中送炭。华为联合宇树科技,基于华为FusionCube A3000训/推超融合一体机、宇树巡检机器人和智能巡检知识库,打造电力场站智慧巡检员,实现智能导航、态势研判、语音识别、资产盘点、智能报表等功能,让巡检更智能、高效、安全。
知识库存储为AI新新人类保驾护航
不难看出,AI新新人类的涌现呈现出井喷特征,场景化大模型商用落地的进程明显提速,预计会有更多的智能机器人脱颖而出,赋能千行万业的智能化转型。
当然,阻碍AI大模型“高产”的诸多因素并未完全消除,AI知识库存储还有很长的路要走。面对新征途上的挑战,华为推出OceanStor A800高性能AI知识库存储,着力解决大模型训练和推理过程中的数据处理效率瓶颈,加速大模型应用上线。
根据了解,OceanStor A800具备超高性能、超快恢复、超强推理三大关键能力。首先,它采用创新的数控分离架构,大幅提升小文件处理性能,存储单框IOPS达到2400万。其次,通过采用创新的盘控协同技术和NFS+并行客户端,实现了500GB/s的超高带宽,TB级Checkpoint大文件的读写仅需十几秒。最后,它内置高速向量知识库,提升了大模型行业知识的深度、精度和时效性,并通过智能向量检索引擎实现了25万+QPS的推理响应,毫秒级的响应时间
站在更长远的视角来看,AI知识库存储的持续进化将进一步优化大模型时代的“气候环境”,AI新新人类英才辈出、迭代升级的未来图景值得期待。下一个AI新新人类会在哪里出现?看看你我的身边,它们可能随时现身。
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
182 收藏
-
249 收藏
-
118 收藏
-
362 收藏
-
264 收藏
-
267 收藏
-
154 收藏
-
212 收藏
-
314 收藏
-
486 收藏
-
340 收藏
-
148 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习