Claude Code Opus 4.7 发布:编程能力再跃升,/ultrareview 命令开启 AI 代码审查新范式
Anthropic 正式发布 Claude Code Opus 4.7,在 93 项编程评测中较 Opus 4.6 提升 13%,并解锁了 4 项此前两个版本均无法解决的难题。Rakuten-SWE-Bench 任务解决率提升 3 倍,Terminal Bench 达 96%(前代仅 54.5%)。同时新增 xhigh 推理强度、/ultrareview 深度审查命令,以及 3.75M 像素图像理解能力。本文解析 Opus 4.7 的核心升级点与开发者接入指南。
声明: 本文所有事实均来自 Anthropic 官方发布页(anthropic.com/news/claude-opus-4-7),无任何未公开内部信息。接入建议基于公开 API 文档。
一、核心升级:编程能力再跃升
Claude Opus 4.7 相较 Opus 4.6 的提升是全方位的,核心数据如下:
| 评测维度 | Opus 4.6 | Opus 4.7 | 变化 |
|---|---|---|---|
| 内部 93 项编程评测 | — | — | +13% |
| Rakuten-SWE-Bench 任务解决 | 基准 | 3 倍提升 | 3× |
| Terminal Bench 2.0 | 54.5% | 96% | +76% |
| Code Quality + Test Quality | — | 双位数提升 | — |
| CursorBench | 58% | 70% | +21% |
| Databricks OfficeQA Pro 错误率 | — | -21% | 更少错误 |
| XBOW 视觉精度评测 | 54.5% | 98.5% | +81% |
| GDPval-AA(金融/法律/经济知识工作) | — | SOTA | — |
最令业界震惊的案例:Opus 4.7 从零自主构建了一套完整的 Rust 语音合成引擎——包括神经网络模型、SIMD 优化内核、浏览器演示页面——然后将其输出回传语音识别器进行验证对比。这是此前任何公开模型都未曾完成的工程任务量。
二、架构升级:图像理解与 Tokenizer
图像分辨率提升 3 倍
Opus 4.7 的视觉能力支持图像长边最高 2,576 像素(约 3.75 百万像素),是前代支持量的 3 倍以上。这意味着:
- 计算机操作代理(computer-use agents)可读取更密集的截图和 UI 界面
- 数据提取场景从复杂图表中获取更精细的像素级信息
- 生命科学/专利工作流可直接分析化学结构图和技术图表
这是模型级别的变更,用户无需修改 API 参数,发送图像后模型自动以更高保真度处理。
更新版 Tokenizer
Opus 4.7 采用了更新后的 tokenizer,同等输入映射 Token 数约增加 1.0–1.35 倍(视内容类型而定)。在更高 effort 级别下,Opus 4.7 推理 Token 也会更多——这是可靠性提升的代价。Anthropic 提供官方迁移指南,建议开发者在真实流量上测量差异后再决定切换策略。
三、安全:首批接入 Project Glasswing 防护
Opus 4.7 是 Anthropic Project Glasswing 的首个落地模型:内置自动检测与拦截机制,对高风险网络安全用途的请求进行阻断。Anthropic 从 Opus 4.7 开始逐步积累真实部署经验,为未来 Mythos 级模型的广泛开放做准备。
有意将 Opus 4.7 用于正规网络安全研究、渗透测试、红队演练的开发者,可申请加入 Cyber Verification Program。
四、新功能:xhigh 推理强度与 /ultrareview
推理控制新增 xhigh 级别
Opus 4.7 在 high 和 max 之间新增 xhigh(extra high) effort 参数,给开发者提供更精细的「推理质量 vs 延迟」调节工具。Claude Code 已将所有计划的默认 effort 级别提升至 xhigh。Anthropic 建议:编程和智能体场景从 high 或 xhigh 开始调优。
/ultrareview 深度审查命令
Claude Code 为 Pro 和 Max 用户推出 /ultrareview 命令,可对代码变更进行专注的审查会话,自动发现「细心人工审查员才能发现」的 bug 和设计问题。所有 Pro 和 Max 用户可免费试用 3 次。
Auto Mode 向 Max 用户开放
Auto mode(Claude 代替用户做决策的执行模式)现已向 Max 用户开放,支持更长的任务持续运行和更少的交互中断。
五、定价与接入
Opus 4.7 定价与 Opus 4.6 完全相同:
| 指标 | 价格 |
|---|---|
| 输入 Token | $5 / 百万 tokens |
| 输出 Token | $25 / 百万 tokens |
接入渠道:Claude API(platform.claude.com)、Amazon Bedrock、Google Vertex AI、Microsoft Foundry。
六、NixAPI 接入路径
Opus 4.7 是 NixAPI 多模型路由的核心候选模型。建议接入路径:
// providers/anthropic-opus47.ts
export const opus47 = createOpenAICompatibleClient({
baseURL: 'https://api.anthropic.com/v1',
apiKey: process.env.ANTHROPIC_API_KEY,
defaultModel: 'claude-opus-4-7',
defaultHeaders: {
'anthropic-version': '2023-06-01',
'anthropic-dangerous-direct-browser-access': 'true',
},
});
// 编程任务路由
export async function routeCodingTask(task: CodingTask) {
// 高难编程 → Opus 4.7 xhigh
if (task.difficulty === 'hard' && task.type === 'swe') {
return opus47.chat(task.messages, { effort: 'xhigh' });
}
// 中等难度 → Sonnet 4.6
if (task.difficulty === 'medium') {
return sonnet46.chat(task.messages, { effort: 'high' });
}
// 简单任务 → MiniMax M2.7
return minimax27.chat(task.messages);
}
七、关键结论
Claude Opus 4.7 的核心价值在于可靠性跃升:更少放弃、更少 tool error、更少无意义 wrapper 代码。Hex 的评价最为精准——「低投入使用 Opus 4.7 ≈ 中等投入使用 Opus 4.6」。对于 NixAPI 这样的多模型 API 网关,Opus 4.7 是复杂、长周期编程任务的首选默认模型。