Skip to content
tinAI
Go back

Claude 4.7 Tốn Nhiều Token Hơn 4.6 Đến 1.47x — Đây Là Số Thực

Bài gốc: I Measured Claude 4.7's New Tokenizer. Here's What It Costs You.

Tác giả: Claude Code Camp

Ngày đăng: Dịch ngày:

TL;DR

Anthropic nói tokenizer mới của Claude Opus 4.7 dùng "roughly 1.0 đến 1.35x" token hơn 4.6. Đo thực tế thì khác: CLAUDE.md file tăng 1.445x, technical docs tăng 1.47x, TypeScript code tăng 1.36x. CJK không bị ảnh hưởng (1.01x). Nếu bạn dùng Claude Code với content tiếng Anh hoặc code, quota sẽ hết nhanh hơn đáng kể.

Vấn đề

Anthropic ghi trong migration guide: tokenizer mới của Claude Opus 4.7 dùng “roughly 1.0 đến 1.35x” token so với 4.6. Bài viết này đo thực tế và kết quả khác đáng kể.

Phương pháp đo

Dùng API POST /v1/messages/count_tokens — Anthropic’s free token counter, không tốn chi phí inference. Cùng một nội dung, hai model, so sánh trực tiếp.

Hai bộ samples:

Kết quả: Content thực tế của Claude Code users

Content4.6 tokens4.7 tokensTỷ lệ
CLAUDE.md (5KB)1,3992,0211.445x
User prompt thông thường1,1221,5411.373x
Blog post (Markdown)1,2091,6541.368x
Git commit log9101,2231.344x
Terminal output (pytest)6528421.291x
Python stack trace1,7362,1701.250x
Code diff1,2261,4861.212x

Trung bình có trọng số: 1.325x (8,254 → 10,937 tokens).

Kết quả: Theo loại content

Content4.64.7Tỷ lệ
Technical docs (English)4787041.47x
Shell script1,0331,4361.39x
TypeScript code1,2081,6401.36x
Spanish prose7339861.35x
Python code8641,1121.29x
English prose5086111.20x
JSON (dense)13,93915,7061.13x
Japanese prose8568661.01x
Chinese prose7797891.01x

CJK (Nhật, Trung) không bị ảnh hưởng — 1.01x trên cả hai.

Lý do kỹ thuật

Ba pattern từ dữ liệu:

  1. CJK, emoji, symbols: 1.005–1.07x — vocabulary mới không thay đổi nhiều ở phần non-Latin.

  2. English và code: 1.20–1.47x — 4.7 dùng sub-word merges ngắn hơn hoặc ít hơn cho các pattern English và code phổ biến so với 4.6.

  3. Code bị ảnh hưởng nặng hơn prose (1.29–1.39x vs 1.20x) — Code có nhiều high-frequency strings lặp lại (keywords, imports, identifiers) — chính xác là những pattern mà BPE tokenizer trained trên code sẽ collapse thành long merges.

Chars-per-token với English: giảm từ 4.33 xuống 3.60. TypeScript: giảm từ 3.66 xuống 2.69.

Ý nghĩa với dev

Nếu bạn đang chạy Claude Code với context lớn bằng tiếng Anh hoặc code:

Giá sticker không đổi, nhưng effective cost tăng. Anthropic có thể đang trading điều này cho model quality tốt hơn — bài viết gốc còn đo cả phần “bạn nhận lại được gì” nhưng phần đó cần đọc trực tiếp.

Code đo

from anthropic import Anthropic
client = Anthropic()
for model in ["claude-opus-4-6", "claude-opus-4-7"]:
    r = client.messages.count_tokens(
        model=model,
        messages=[{"role": "user", "content": sample_text}],
    )
    print(f"{model}: {r.input_tokens} tokens")

API count_tokens miễn phí, không tốn inference cost. Có thể tự đo với content của mình.


Read Original (EN) Quay lại Newsletter