首页 > 科技周边 > 业界新闻

阿里云通义开源推理大模型QwQ，推理水平比肩OpenAI o1

时间：2025-01-14 17:12:36 500浏览收藏

各位小伙伴们，大家好呀！看看今天我又给各位带来了什么文章？本文标题是《阿里云通义开源推理大模型QwQ，推理水平比肩OpenAI o1》，很明显是关于科技周边的文章哈哈哈，其中内容主要会涉及到等等，如果能帮到你，觉得很不错的话，欢迎各位多多点评和分享！

阿里云重磅发布！开源AI推理模型QwQ-32B-Preview惊艳亮相，推理能力媲美OpenAI！

11月28日，阿里云通义团队正式开源了其全新AI推理模型QwQ-32B-Preview，并在多个平台开放体验。测试结果显示，该模型在数学、编程等领域展现出令人瞩目的研究生级推理能力，整体水平与OpenAI的o1模型不相上下。

QwQ（Qwen with Questions），作为通义千问Qwen大模型的实验性分支，是阿里云首个开源的AI推理模型。阿里云团队的研究表明，充分的思考、质疑和反思能够显著提升模型对数学和编程的理解。QwQ正是基于这一理念取得了突破性进展。

在多项权威评测中，QwQ表现出色：GPQA评测集（科学问题解决能力）准确率达65.2%；AIME评测（综合数学）胜率50%；MATH-500评测（数学解题能力）得分高达90.6%，超越o1-preview和o1-mini；LiveCodeBench评测（高难度代码生成）答对率达50%。

QwQ的独特之处在于其深度自省能力。面对复杂问题，它能够质疑自身假设，进行深入的自我反思，并仔细检查每一步推理过程。例如，在“猜牌问题”中，QwQ通过分析对话和情境，展现了其缜密的思考能力，最终得出正确答案。

目前，QwQ-32B-Preview已在魔搭社区和HuggingFace平台开源，并迅速引发全球开发者的关注和热议。虽然QwQ展现出强大的分析能力，但阿里云团队也指出，该模型仍处于实验阶段，存在一些局限性，例如语言混合使用、潜在偏见以及对专业领域知识的不足。团队表示，这些问题将在后续的研究和迭代中逐步解决。

访问链接：

Modelscope开源地址: https://modelscope.cn/models/Qwen/QwQ-32B-Preview
Modelscope创空间体验: https://modelscope.cn/studios/Qwen/QwQ-32B-preview
HuggingFace开源地址: https://huggingface.co/Qwen/QwQ-32B-Preview
HuggingFace Space体验: https://huggingface.co/spaces/Qwen/QwQ-32B-preview

今天关于《阿里云通义开源推理大模型QwQ，推理水平比肩OpenAI o1》的内容就介绍到这里了，是不是学起来一目了然！想要了解更多关于的内容请关注golang学习网公众号！