登录
首页 >  科技周边 >  人工智能

百度侯震宇:利用AI原生和大模型重塑云计算的三个层面

来源:搜狐

时间:2023-12-20 21:44:03 479浏览 收藏

小伙伴们对科技周边编程感兴趣吗?是否正在学习相关知识点?如果是,那么本文《百度侯震宇:利用AI原生和大模型重塑云计算的三个层面》,就很适合你,本篇文章讲解的知识点主要包括。在之后的文章中也会多多分享相关知识点,希望对大家的知识积累有所帮助!

2023年12月20日,在百度云智大会·智算大会期间,百度智能云宣布,为了满足大型模型的需求,正在基于“云智一体”战略对云计算服务进行重构。目前已经完成了从底层基础设施到大型模型开发与应用再到AI原生应用开发的端到端升级重构。这次重构包括对百舸等20多个云计算基础设施的全面升级,对千帆大模型平台的再升级,以及AI原生应用开发工作台“千帆AppBuilder”的全面开放

智算大会现场,百度智能云还公布了最新的“成绩单”。自从8月31日文心大模型向全社会全面开放以来,在千帆大模型平台上,大模型API的日调用量增长了10倍。目前,千帆平台已经累计服务了超过4万家企业用户,帮助他们精调了近1万个大模型。相较于自建系统训练大模型,使用千帆平台训练的成本最高可以下降90%

“AI原生时代已经开始,大型模型正在推动云计算行业的创新变革。”百度集团副总裁侯震宇表示:“大型模型对云计算的重构主要体现在三个方面:AI原生云将会改变云计算的格局,模型即服务(MaaS)将成为新的基础服务,AI原生应用将催生新的研发范式。”

百度侯震宇:AI原生与大模型将从三个层面重构云计算

首先,在移动互联网时代的应用中,云基础设施层的底层大多依赖于CPU算力。然而,随着AI应用对GPU或异构计算的需求不断增加,云市场的底层算力需求将逐渐转向以GPU为主

在模型层面,大型模型正在成为普遍的服务能力,即MaaS。MaaS的实施将大幅度降低人工智能应用的门槛,实现真正的人工智能普及化

在应用层,应用开发的范式已经被彻底颠覆。大模型理解、生成、逻辑、记忆的独特能力会催生A原生应用研发新范式,整个应用技术栈、数据流和业务流都将被改变

侯震宇表示,总的来说,要构建繁荣的A原生应用生态,需要三个要素相辅相成,即大模型、智能算力和AI原生应用研发的新范式。大模型是AI原生应用的"大脑",智能计算为A原生应用的运行提供了坚实的支持,新的研发范式则帮助开发者高效地基于大模型能力来开发应用。数据飞轮是成功的AI原生应用的充分必要条件,它使得大模型能力能够高速迭代,从而让产品体验持续不断地改进

AI原生时代,云计算基础设施体系将全面重构,以适应大型模型的需求。侯震宇表示,百度智能云将在三个方面进行重构,分别是:面向模型的智算基础设施、面向数据的数据基础设施、面向应用的云基础设施,以支持AI原生应用的实施

在大会现场,百度智能云还发布和升级了20多款云计算产品,涵盖了智能计算、通用计算、数据库和大数据、分布式云、应用开发平台五个领域

在智能计算领域,算力是实现大型模型应用的基础条件。目前,大型模型的训练、推理和部署对高速互联、计算效率和算力成本等方面提出了高要求,因此需要建立新型的智能计算基础设施。然而,目前的计算集群面临许多挑战,包括大型模型训练时间长、容易出错以及稳定性差的问题。此外,算力集群规模大、系统复杂度高也增加了运维的难度

百度最新发布的百度百舸·AI异构计算平台3.0,对于AI原生应用以及大型模型的训练和推理等环节进行了专门优化。百舸3.0在稳定性、高效性和易于运维方面都有显著提升,实现了对万卡级任务的有效训练时间超过98%,带宽利用率可达95%。相较于自建的智能计算基础设施,百度百舸3.0可以实现模型训练和推理的吞吐量分别最高提升30%和60%

为了解决AI原生时代智能算力供给平衡的问题,百度智能云发布了智算网络平台。在算力资源方面,智算网络平台支持将百度和第三方建设的智算中心、超算中心、边缘节点等智算节点进行全域接入,将分散和异构的算力资源连接起来,形成统一的算力网络资源池。通过百度自主研发的算力调度算法,智算网络平台可以智能地分析各类算力资源的状态、性能和利用率等指标,并统一调度算力,使智算资源可以灵活、稳定、高效地交付给有需求的用户,实现智算资源的“南水北调”

在云原生基础设施中,包括计算、存储和网络等方面,为了适应人工智能时代的需求,需要进行重构和升级,以提供更具弹性、高性能和智能化的运维能力

百度太行·计算在本次大会上新增了三款计算实例。首先是全新推出的第7代(通用计算型)云服务器实例G7,综合性能比上一代产品提升了10%。其次是昆仑芯弹性裸金属实例NKL5,该实例搭载了百度自研的昆仑芯R300加速处理器,在大型推理场景中综合性能比业界主流加速卡提升了50%。最后是基于昇腾910B加速处理器打造的弹性高性能计算实例NH6T,在大型训练场景中综合性能比业界主流加速卡提升了40%

同时,我们正式发布了高性能计算平台CHPC(Cloud HPC),为用户提供一站式的公共云HPC服务。在资源使用方面,CHPC支持用户一键创建高性能计算环境,并根据业务变化灵活使用云上资源;在业务应用层面,CHPC支持集成药物研发、基因测序等行业的应用。此外,结合集成在VPC内的百度网盘等服务,用户可以轻松实现HPC源文件的提交、上传、处理、结果回传以及数据分发的全链路打通,助力研发提高效率

百度智能云在分布式云领域进行了三大升级:首先,边缘计算节点BEC产品能力得到了提升,建立了全球统一的边缘计算网络和产品体验,实现了“云边一体”的完善能力;其次,专有云ABC Stack发布了新的能力,支持在本地部署百度智能云的千帆大模型平台;最后,本地计算集群LCC也发布了新的能力,支持全新一代的CPU/GPU实例以及完整的百度智能云AI和HPC集群管理能力,进一步丰富完善了基础设施和云产品的支持能力矩阵

大模型落地的成功不仅需要强大的计算能力支持,还需要有效地存储、管理和分析各种数据和海量的知识。百度智能云在云存储、云原生数据库、大数据平台等数据基础设施领域发布了一系列重要的新产品

百度沧海·存储,统一技术底座正式发布,能够支持各类存储产品,同时满足AI原生时代的大规模、高性能、低成本的存储要求。全新升级的对象存储BOS、云磁盘CDS、并行文件存储PFS等产品,面向数据湖存储和AI存储能力进行了全面增强,加速智能计算,释放数据价值

GaiaDB 4.0版本已正式发布,该版本增强了并行查询能力,突破了单机计算的瓶颈,实现了在跨机多核环境下的并行查询。在混合负载和实时分析业务场景中,性能提升超过10倍。为了提高不同规模数据的查询速度,该版本推出了列存索引和列存引擎。其中,列存引擎最大可支持PB级数据的复杂分析,并且与事务处理业务严格隔离。通过优化共识协议、链路和自适应动态回放存储多个版本的数据流,GaiaDB的整体性能提升了60%以上

在这次智能计算大会上,针对应用大型模型最重要的"提高效率"和"降低成本"两个核心需求,百度智能云千帆大型模型平台发布了一系列全新功能,包括数据统计分析和数据质量检查等。此外,为了满足企业对于敏捷高效的原生人工智能应用开发需求,降低原生人工智能应用开发门槛,百度智能云千帆AppBuilder也正式开放服务

今天关于《百度侯震宇:利用AI原生和大模型重塑云计算的三个层面》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于云计算 (Cloud Computing),AI原生 (Native AI),大模型 (Large-scale Models)的内容请关注golang学习网公众号!

声明:本文转载于:搜狐 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>