登录
首页 >  科技周边 >  人工智能

北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库

来源:51CTO.COM

时间:2023-05-19 11:03:03 439浏览 收藏

对于一个科技周边开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库》,主要介绍了,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!

北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库

5 月 17 日消息,北京市于 5 月 12 日发布了关于对《北京市促进通用人工智能创新发展的若干措施(2023-2025 年)(征求意见稿)》(下称《征求意见稿》)公开征集意见的公告,拟对 AI 训练所需的算力推行统筹供给。

北京拟对 AI 训练所需的算力推行统筹供给,整合大模型中文语料库

《征求意见稿》提出,加强算力资源统筹供给能力,加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员,明确供给技术标准、软硬件服务要求、算力供给规模、优惠策略等,向在京高校院所和中小企业公布一批优质算力供应商。

《征求意见稿》称,利用政府统一入口,降低公有云采购成本,普惠中小企业,同时减少企业分别面对不同云厂商的沟通成本。针对弹性算力需求,建设统一的多云算力调度平台,实现异构算力环境统一管理、统一运营,方便企业在不同云环境上无缝、经济、高效地运行各类人工智能计算任务。建设北京与河北、天津、山西、内蒙古等省(市)算力集群的直连基础光传输网络,进一步提升平台对四地算力资源感知能力,探索开展算力交易。

《征求意见稿》还表示,针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。同时持续扩展高质量多模态数据来源,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,通过北京国际大数据交易所社会数据专区进行定向有条件开放。

IT之家附《北京市促进通用人工智能创新发展的若干措施(2023-2025 年)(征求意见稿)》完整文件:点此查看


今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

声明:本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表