登录
首页 >  科技周边 >  业界新闻

阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1

时间:2025-01-14 17:12:36 500浏览 收藏

各位小伙伴们,大家好呀!看看今天我又给各位带来了什么文章?本文标题《阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1》,很明显是关于科技周边的文章哈哈哈,其中内容主要会涉及到等等,如果能帮到你,觉得很不错的话,欢迎各位多多点评和分享!

阿里云重磅发布!开源AI推理模型QwQ-32B-Preview惊艳亮相,推理能力媲美OpenAI!

11月28日,阿里云通义团队正式开源了其全新AI推理模型QwQ-32B-Preview,并在多个平台开放体验。测试结果显示,该模型在数学、编程等领域展现出令人瞩目的研究生级推理能力,整体水平与OpenAI的o1模型不相上下。

阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1

QwQ(Qwen with Questions),作为通义千问Qwen大模型的实验性分支,是阿里云首个开源的AI推理模型。阿里云团队的研究表明,充分的思考、质疑和反思能够显著提升模型对数学和编程的理解。QwQ正是基于这一理念取得了突破性进展。

在多项权威评测中,QwQ表现出色:GPQA评测集(科学问题解决能力)准确率达65.2%;AIME评测(综合数学)胜率50%;MATH-500评测(数学解题能力)得分高达90.6%,超越o1-preview和o1-mini;LiveCodeBench评测(高难度代码生成)答对率达50%。

QwQ的独特之处在于其深度自省能力。面对复杂问题,它能够质疑自身假设,进行深入的自我反思,并仔细检查每一步推理过程。例如,在“猜牌问题”中,QwQ通过分析对话和情境,展现了其缜密的思考能力,最终得出正确答案。

目前,QwQ-32B-Preview已在魔搭社区和HuggingFace平台开源,并迅速引发全球开发者的关注和热议。 虽然QwQ展现出强大的分析能力,但阿里云团队也指出,该模型仍处于实验阶段,存在一些局限性,例如语言混合使用、潜在偏见以及对专业领域知识的不足。团队表示,这些问题将在后续的研究和迭代中逐步解决。

访问链接:

今天关于《阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>