Claude Opus 4.7: Mạnh hơn, nhìn tốt hơn, và effort level mới

Giới thiệu

Claude Opus 4.7 là model mới nhất của Anthropic trong dòng Claude 4, ra mắt hôm nay trên tất cả platform: API trực tiếp, Amazon Bedrock, Google Cloud Vertex AI, và Microsoft Foundry.

Giá: $5/triệu input tokens và $25/triệu output tokens — không đổi so với Opus 4.6.

API identifier: claude-opus-4-7

Có gì mới

Lập trình và reasoning tốt hơn

Opus 4.7 cải thiện đáng kể so với Opus 4.6 trên coding:

CursorBench: 70% vs 58% của Opus 4.6
SWE-bench Verified: tăng 13% task resolution
Rakuten-SWE-Bench: giải quyết được 3x nhiều production task hơn Opus 4.6
Notion Agent: +14% so với Opus 4.6 với ít token hơn và 1/3 số tool errors

Nhiều đối tác nhận xét Opus 4.7 “tự phát hiện lỗi logic trong giai đoạn planning” và “ít cần giám sát hơn trên các tác vụ dài”.

Vision cải thiện 3x

Opus 4.7 hỗ trợ ảnh lên đến 2,576 pixels cạnh dài (~3.75 megapixels) — gấp hơn 3 lần so với các model Claude trước. Ứng dụng thực tế:

Computer-use agent đọc screenshot dày đặc text
Trích xuất dữ liệu từ diagram phức tạp
Xử lý tài liệu kỹ thuật cần độ chính xác cao về hình ảnh

XBOW báo cáo visual-acuity benchmark tăng từ 54.5% (Opus 4.6) lên 98.5% (Opus 4.7).

Effort level mới: `xhigh`

Anthropicthêm mức effort xhigh (nằm giữa high và max), kiểm soát tốt hơn tradeoff giữa chất lượng reasoning và latency. Trong Claude Code, mức mặc định đã nâng lên xhigh.

Tính năng mới trên Claude Code

/ultrareview: Command mới tạo phiên review chuyên sâu, phát hiện bugs và design issues. Pro/Max users có 3 lần thử miễn phí.
Auto mode mở rộng cho Max users: Claude tự quyết định permissions, giảm interruptions khi chạy tác vụ dài.
Task budgets (public beta): giới hạn token spend theo tác vụ.

Cyber safeguards

Opus 4.7 là model đầu tiên có built-in safeguards tự động detect và block request cybersecurity độc hại. Security professionals dùng cho penetration testing và vulnerability research cần đăng ký Cyber Verification Program.

Thay đổi quan trọng khi migrate

Tokenizer mới

Opus 4.7 dùng tokenizer mới — cùng input có thể sinh ra 1.0–1.35x token nhiều hơn tùy loại content.

Thinking nhiều hơn ở effort cao

Ở effort cao trong agentic workflows, Opus 4.7 “think” nhiều hơn → output tokens tăng. Độ tin cậy tốt hơn nhưng chi phí có thể tăng.

Cách kiểm soát token usage

Dùng effort parameter (low, medium, high, xhigh, max)
Sử dụng task budgets (public beta) để giới hạn token spend
Prompt model yêu cầu concise hơn

Cách nâng cấp

# Cũ
client.messages.create(model="claude-opus-4-6", ...)

# Mới
client.messages.create(model="claude-opus-4-7", ...)

Anthropic có migration guide chi tiết. Khuyến nghị test với high hoặc xhigh effort cho coding và agentic use cases.

Lưu ý: Prompts viết cho model cũ có thể cho kết quả khác vì Opus 4.7 follow instructions nghiêm túc hơn — nơi model cũ bỏ qua hoặc interpret loosely, Opus 4.7 sẽ làm đúng từng chữ.

Claude Opus 4.7: Mạnh hơn, nhìn tốt hơn, và effort level mới

TL;DR

Giới thiệu

Có gì mới

Lập trình và reasoning tốt hơn

Vision cải thiện 3x

Effort level mới: `xhigh`

Tính năng mới trên Claude Code

Cyber safeguards

Thay đổi quan trọng khi migrate

Tokenizer mới

Thinking nhiều hơn ở effort cao

Cách kiểm soát token usage

Cách nâng cấp

Đường dẫn nguồn

Claude Opus 4.7: Mạnh hơn, nhìn tốt hơn, và effort level mới

TL;DR

Giới thiệu

Có gì mới

Lập trình và reasoning tốt hơn

Vision cải thiện 3x

Effort level mới: xhigh

Tính năng mới trên Claude Code

Cyber safeguards

Thay đổi quan trọng khi migrate

Tokenizer mới

Thinking nhiều hơn ở effort cao

Cách kiểm soát token usage

Cách nâng cấp

Đường dẫn nguồn

Cùng bản tin này

Effort level mới: `xhigh`