首页 > 科技周边 > 人工智能

陶哲轩：通义千问QwQ奥数真厉害，开源大模型顶流

时间：2024-12-04 14:37:09 244浏览收藏

从现在开始，努力学习吧！本文《陶哲轩：通义千问QwQ奥数真厉害，开源大模型顶流》主要讲解了等等相关知识点，我会在golang学习网中持续更新相关的系列文章，欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧，希望能帮到你！

阿里云通义千问团队最新发布的开源AI推理模型QwQ-32B，在AI数学奥林匹克竞赛AIMO中表现惊艳，展现出强大的数学和编程能力，甚至在部分测试中超越了OpenAI的o1模型。

QwQ，全称Qwen with Questions，是一个实验性研究模型，其核心在于赋予模型更充分的思考、质疑和反思时间，从而提升其对复杂问题的理解和解决能力。在不到一天前，就有参赛团队使用QwQ-32B在AIMO竞赛中取得了18/20的高分，有望率先获得“Early Sharing Prize”奖金。

菲尔茨奖得主陶哲轩教授在本周五介绍了AIMO竞赛的最新进展，并指出QwQ在解决数学竞赛问题方面表现优异。第二届AIMO竞赛奖金池已达211.7万美元，参赛团队需公开代码、方法、数据和模型参数。本届竞赛中，QwQ系列模型占据主导地位。

QwQ的强大推理能力也体现在其他方面，社交媒体上许多用户对其推理过程赞赏有加。 HuggingFace团队也对其测试结果表示惊叹。有趣的是，QwQ的思考过程似乎以中文为基础，这或许是其逻辑能力强大的原因之一。

在多个权威评测集上，QwQ均取得了优异成绩：GPQA评测集（科学推理）准确率达65.2%（研究生水平）；AIME评测集（综合数学）胜率50%；MATH-500评测集（数学解题）得分90.6%，超越o1-preview和o1-mini；LiveCodeBench评测集（代码生成）答对一半题目。 QwQ甚至能够在“猜牌”等经典智力题中，通过自我对话和反思，最终得出正确答案。

尽管QwQ展现出强大的潜力，但阿里云团队也强调其仍处于实验阶段，存在一些局限性，例如语言混合使用、潜在偏见等，未来将通过持续研究和迭代改进。

HuggingFace开源地址: https://huggingface.co/Qwen/QwQ-32B-Preview
HuggingFace Space体验: https://huggingface.co/spaces/Qwen/QwQ-32B-preview

QwQ的出现，标志着开源大模型领域新一轮的竞争格局正在形成。

今天关于《陶哲轩：通义千问QwQ奥数真厉害，开源大模型顶流》的内容介绍就到此结束，如果有什么疑问或者建议，可以在golang学习网公众号下多多回复交流；文中若有不正之处，也希望回复留言以告知！

产业陶哲轩 QwQ