登录
首页 >  科技周边 >  人工智能

通义千问开源320亿参数模型,已实现7款大语言模型全开源

来源:机器之心

时间:2024-04-29 21:15:27 142浏览 收藏

本篇文章给大家分享《通义千问开源320亿参数模型,已实现7款大语言模型全开源》,覆盖了科技周边的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。

4月7日消息,阿里云通知千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,为企业和开发者提供更高性价比的模型选择。目前,通知千问共开源6款大语言模型,在海内外开源社区累计下载量突破300万。

通用问题千问此前已开发了5亿、18亿、40亿、70亿、140亿和720亿参数模型,并均已升级至1.5版本。其中,几款小尺寸模型可便捷地部署在端侧,720亿参数模型则拥有业界领先的性能,多次登上HuggingFace等模型榜单。此次开源的320亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。例如,相比于相14B模型,32B在智能体场景下能力更强;相比于72B,32B的推理成本更低。通用问题团队希望32B开源模型能为下游应用提供更优的解决方案。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

基础能力方面,通过千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测试中表现优异,性能接近千问720亿参数模型,远超其300亿级参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

有着丰富语言能力的人,在选择了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言后,可以在考试、理解、数学及翻译等多个领域做了评估。Qwen1.5-32B的多语言能力仅仅限于通用千问720亿参数模型。

通义千问开源320亿参数模型,已实现7款大语言模型全开源

理论要掌握,实操不能落!以上关于《通义千问开源320亿参数模型,已实现7款大语言模型全开源》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

声明:本文转载于:机器之心 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>