Giới thiệu
Claude Opus 4.7 là model mới nhất của Anthropic trong dòng Claude 4, ra mắt hôm nay trên tất cả platform: API trực tiếp, Amazon Bedrock, Google Cloud Vertex AI, và Microsoft Foundry.
Giá: $5/triệu input tokens và $25/triệu output tokens — không đổi so với Opus 4.6.
API identifier: claude-opus-4-7
Có gì mới
Lập trình và reasoning tốt hơn
Opus 4.7 cải thiện đáng kể so với Opus 4.6 trên coding:
- CursorBench: 70% vs 58% của Opus 4.6
- SWE-bench Verified: tăng 13% task resolution
- Rakuten-SWE-Bench: giải quyết được 3x nhiều production task hơn Opus 4.6
- Notion Agent: +14% so với Opus 4.6 với ít token hơn và 1/3 số tool errors
Nhiều đối tác nhận xét Opus 4.7 “tự phát hiện lỗi logic trong giai đoạn planning” và “ít cần giám sát hơn trên các tác vụ dài”.
Vision cải thiện 3x
Opus 4.7 hỗ trợ ảnh lên đến 2,576 pixels cạnh dài (~3.75 megapixels) — gấp hơn 3 lần so với các model Claude trước. Ứng dụng thực tế:
- Computer-use agent đọc screenshot dày đặc text
- Trích xuất dữ liệu từ diagram phức tạp
- Xử lý tài liệu kỹ thuật cần độ chính xác cao về hình ảnh
XBOW báo cáo visual-acuity benchmark tăng từ 54.5% (Opus 4.6) lên 98.5% (Opus 4.7).
Effort level mới: xhigh
Anthropicthêm mức effort xhigh (nằm giữa high và max), kiểm soát tốt hơn tradeoff giữa chất lượng reasoning và latency. Trong Claude Code, mức mặc định đã nâng lên xhigh.
Tính năng mới trên Claude Code
/ultrareview: Command mới tạo phiên review chuyên sâu, phát hiện bugs và design issues. Pro/Max users có 3 lần thử miễn phí.- Auto mode mở rộng cho Max users: Claude tự quyết định permissions, giảm interruptions khi chạy tác vụ dài.
- Task budgets (public beta): giới hạn token spend theo tác vụ.
Cyber safeguards
Opus 4.7 là model đầu tiên có built-in safeguards tự động detect và block request cybersecurity độc hại. Security professionals dùng cho penetration testing và vulnerability research cần đăng ký Cyber Verification Program.
Thay đổi quan trọng khi migrate
Tokenizer mới
Opus 4.7 dùng tokenizer mới — cùng input có thể sinh ra 1.0–1.35x token nhiều hơn tùy loại content.
Thinking nhiều hơn ở effort cao
Ở effort cao trong agentic workflows, Opus 4.7 “think” nhiều hơn → output tokens tăng. Độ tin cậy tốt hơn nhưng chi phí có thể tăng.
Cách kiểm soát token usage
- Dùng
effortparameter (low,medium,high,xhigh,max) - Sử dụng task budgets (public beta) để giới hạn token spend
- Prompt model yêu cầu concise hơn
Cách nâng cấp
# Cũ
client.messages.create(model="claude-opus-4-6", ...)
# Mới
client.messages.create(model="claude-opus-4-7", ...)
Anthropic có migration guide chi tiết. Khuyến nghị test với high hoặc xhigh effort cho coding và agentic use cases.
Lưu ý: Prompts viết cho model cũ có thể cho kết quả khác vì Opus 4.7 follow instructions nghiêm túc hơn — nơi model cũ bỏ qua hoặc interpret loosely, Opus 4.7 sẽ làm đúng từng chữ.