登录
首页 >  科技周边 >  人工智能

Claude Opus 4.7发布,Anthropic旗舰大模型登场

时间:2026-05-16 17:12:43 107浏览 收藏

Anthropic正式推出全新旗舰大模型Claude Opus 4.7,以64.3%的SWE-bench Pro高分刷新编程能力新高度,视觉分辨率跃升至2576像素(约375万像素)、自我验证机制大幅降低人工干预需求,并首次支持xhigh effort档位与Task Budgets资源自主分配,配合Ultrareview深度代码审查、长程多步骤任务稳定执行及MCP-Atlas工具链高效调用,在软件工程、高精度视觉分析、金融建模和跨会话复杂工作流等场景全面领先同类模型——无论你是开发者、数据科学家还是AI原生应用构建者,现在就能通过Claude官网、API或Amazon Bedrock等主流平台即刻体验这一真正具备“自主思考+精准执行”能力的下一代智能体。

Claude Opus 4.7是什么

Claude Opus 4.7 是 Anthropic 推出的最新旗舰大模型,为 Claude Opus 4.6 的直接升级版。模型在高级软件工程任务上表现突出,SWE-bench Pro 得分提升至 64.3%,视觉分辨率支持提升至 2,576 像素(约 3.75 兆像素),具备自我验证与长程自主执行能力。模型现已全面上线 Claude 全系产品、API 及 Amazon Bedrock 等主流云平台。

Claude Opus 4.7— Anthropic 推出的最新旗舰大模型

Claude Opus 4.7的主要功能

  • 高难度编程:在 SWE-bench Pro 测试中得分 64.3%,可自主处理复杂长时软件开发任务并自我验证结果。
  • 超高分辨率视觉:支持长边 2,576 像素(约 375 万像素)的图像输入,是前代模型的 3 倍以上。
  • 自主纠错机制:在汇报最终结果前主动检查逻辑错误,内部修正后再输出,减少人工介入。
  • 长程任务执行:可连贯运行数小时的多步骤复杂工作流,保持稳定性和一致性。
  • 多模态理解:精准解读密集截图、复杂技术图表、化学结构及像素级视觉细节。
  • 智能工具调用:支持 MCP-Atlas 等扩展工具链,工具调用错误率降低约 1/3。
  • 文件系统记忆:跨多会话长任务中记住关键笔记,减少重复上下文输入。
  • 新增 effort 档位:新增 xhigh 档位(位于 high 与 max 之间),Claude Code 默认采用此档位。
  • Task Budgets:支持为长任务设置 token 预算,由模型自主分配资源。
  • Ultrareview 命令:Claude Code 新增独立审查会话,深度检查代码改动与潜在问题。

如何使用Claude Opus 4.7

  • 平台访问
    • Claude 网页/App:直接在模型选择器切换至 Opus 4.7 即可使用。
    • API 调用:模型 ID 为 claude-opus-4-7,通过 Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 或 Microsoft Foundry 调用。
    • Claude Code:已默认将 effort 档位提升至 xhigh,输入 /ultrareview 可启动深度代码审查。
  • API 关键参数设置
    • effort 档位:通过 effort 参数控制响应规模,选项为 low / medium / high / xhigh / max。编程与 agentic 场景建议使用 high 或 xhigh 起步。
    • task budgets(公测):设置长任务 token 预算,让模型自主分配资源,与 effort 参数配合使用更精细。
    • thinking 参数:已弃用 thinking: {type: "enabled", budget_tokens: N},改为使用 thinking: {type: "adaptive"} 配合 effort 参数。
  • 高分辨率视觉:直接上传长边不超过 2,576 像素的原图,无需自行压缩,模型自动处理高分辨率输入。
  • Claude Code 特有指令
    • 输入 /ultrareview 启动独立审查会话,对代码改动进行深度检查(Pro 和 Max 用户每月限免 3 次)。
    • Auto mode 已下放至 Max 用户,可在 --dangerously-skip-permissions 与默认模式间提供中间档安全选项。

Claude Opus 4.7的关键信息和使用要求

  • 模型定位:Opus 4.6 的直接升级版,Anthropic 最新旗舰模型,现已全面上线 Claude 全系产品、API、Amazon Bedrock、Google Cloud Vertex AI 及 Microsoft Foundry。
  • 核心升级:高难度软件工程任务能力显著提升(SWE-bench Pro 达 64.3%),视觉分辨率支持长边 2,576 像素(约 375 万像素,为前代 3 倍以上),具备自我验证与长程自主执行能力。
  • 定价策略:维持 Opus 4.6 价格,输入 $5/百万 token,输出 $25/百万 token,模型 ID 为 claude-opus-4-7。
  • 新增档位:在 high 与 max 之间新增 xhigh effort 档位,Claude Code 默认已切换至此档位。
  • Tokenizer 变更:新 tokenizer 下相同文本的 token 数约为旧版的 1.0–1.35 倍,需预留更高 token 预算。

Claude Opus 4.7的核心优势

  • 高难度编程突破:在 SWE-bench Pro 测试中得分 64.3%,较 4.6 提升 11 个百分点,可自主处理最复杂的软件工程任务。
  • 自我验证机制:在汇报结果前主动检查逻辑错误并内部修正,显著降低人工介入频率,提升长任务可靠性。
  • 视觉感知跃升:支持 2,576 像素长边(约 375 万像素)的高分辨率图像,视觉感知基准从 54.5% 跃升至 98.5%。
  • 长程任务稳定性:可连贯运行数小时的多步骤复杂工作流,不会因中途难题而放弃,保持执行一致性。
  • 严格指令遵循:对指令的字面执行精度大幅提升,减少模糊解读,确保按用户意图精确完成。
  • 工具调用效率:工具调用错误率降低约三分之一,token 使用效率在多步 agentic 场景中显著优化。

Claude Opus 4.7的项目地址

  • 项目官网:http://www.anthropic.com/news/claude-opus-4-7

Claude Opus 4.7的同类竞品对比

评测维度 Claude Opus 4.7 GPT-5.4 Gemini 3.1 Pro
Agentic coding (SWE-bench Pro) 64.3% 57.7% 54.2%
Agentic coding (SWE-bench Verified) 87.6% 80.6%
Agentic terminal coding (Terminal-Bench 2.0) 69.4% 75.1% 68.5%
Multidisciplinary reasoning (Humanity’s Last Exam w/ tools) 54.7% 58.7% 51.4%
Agentic search (BrowseComp) 79.3% 89.3% 85.9%
Scaled tool use (MCP-Atlas) 77.3% 68.1% 73.9%
Agentic computer use (OSWorld-Verified) 78.0% 75.0%
Agentic financial analysis (Finance Agent v1.1) 64.4% 61.5% 59.7%
Graduate-level reasoning (GPQA Diamond) 94.2% 94.4% 94.3%
Visual reasoning (CharXiv w/ tools) 91.0%
Multilingual Q&A (MMLU) 91.5% 92.6%

Claude Opus 4.7的应用场景

  • 高难度软件开发:支持处理复杂的软件工程任务,如大规模代码重构、复杂算法实现,可自主运行数小时并在汇报前自我验证结果,GitHub 实测任务解决率提升 13%。
  • 高分辨率视觉分析:模型能解读密集 UI 截图、技术图表、化学结构及像素级视觉细节,适用于计算机视觉代理、自动化渗透测试和生命科学专利工作流。
  • 长程自主工作流:自动执行跨多会话的复杂多步骤任务,如深度数据分析、研究报告生成,能够在长时间运行中保持一致性和连贯性,减少人工介入。
  • 金融与商业分析:模型能进行严谨的财务建模、投资分析和专业演示文稿生成,在 Finance Agent v1.1 基准测试中得分 64.4%,可产出严谨的分析模型和高质量商业交付物。

好了,本文到此结束,带大家了解了《Claude Opus 4.7发布,Anthropic旗舰大模型登场》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多科技周边知识!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>