Có gì mới
GPT-5.5 là model thông minh nhất của OpenAI hiện tại, tập trung vào agentic coding, computer use và research. Điểm đáng chú ý nhất: latency per-token giữ nguyên như GPT-5.4 nhưng khả năng tăng đáng kể, và model sinh ra ít token hơn cho cùng task trên Codex.
Hai model được release:
gpt-5.5: model standardgpt-5.5-pro: variant compute cao hơn cho task khó
Benchmark nổi bật
| Benchmark | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | Gemini 3.1 Pro |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 82.7% | 75.1% | 69.4% | 68.5% |
| Expert-SWE (Internal) | 73.1% | 68.5% | - | - |
| GDPval (wins/ties) | 84.9% | 83.0% | 80.3% | 67.3% |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | - |
| FrontierMath Tier 4 | 35.4% | 27.1% | 22.9% | 16.7% |
| ARC-AGI-2 (Verified) | 85.0% | 73.3% | 75.8% | 77.1% |
| Graphwalks BFS 1M f1 | 45.4% | 9.4% | 41.2% (4.6) | - |
Graphwalks jump từ 9.4% lên 45.4% ở 1M token là con số cho thấy long-context thực sự cải thiện — không chỉ hỗ trợ trên paper mà dùng được trong thực tế.
Thay đổi quan trọng
Pricing
Trong API (sắp ra mắt):
- GPT-5.5: $5/1M input, $30/1M output
- GPT-5.5 Pro: $30/1M input, $180/1M output
- Context window: 1M tokens
- Batch & Flex: giảm một nửa giá standard
- Priority: 2.5x giá standard
So với Claude Opus 4.7 ($15/$75), GPT-5.5 rẻ bằng một phần ba trên input và output.
Trong Codex
- Context window 400K cho Plus, Pro, Business, Enterprise, Edu, Go plans
- Fast mode: sinh token nhanh 1.5x với giá 2.5x — cho ai cần turnaround ngắn
- Codex team tại OpenAI cho biết 85% công ty dùng Codex mỗi tuần
Behavior changes
- Reasoning effort mặc định chuyển sang
medium - Khi
image_detailkhông set hoặc đểauto, model revert về behavior gốc - Chỉ hỗ trợ extended prompt caching — in-memory caching không còn
Cách nâng cấp
Rollout hiện tại
- ChatGPT: GPT-5.5 cho Plus, Pro, Business, Enterprise. GPT-5.5 Pro cho Pro, Business, Enterprise.
- Codex: GPT-5.5 cho Plus, Pro, Business, Enterprise, Edu, Go với context 400K.
- API: chưa available — “sắp ra mắt” (requires safeguards cho scale).
Khi API mở
Trên API chuẩn bị:
- Endpoints:
v1/responses,v1/chat/completions,v1/batch - Features: 1M context, image input, structured outputs, function calling, prompt caching, Batch, tool search, built-in computer use, hosted shell, apply patch, Skills, MCP, web search
- Đáng kiểm tra: extended caching thay cho in-memory, và defaults
reasoning_effort=mediumnếu bạn dựa trênlow
Cyber safeguards
GPT-5.5 được classify là High trong Preparedness Framework về cybersecurity và biology. OpenAI deploy stricter classifiers — một số request có thể bị refuse. Developers làm defensive security có thể apply Trusted Access tại chatgpt.com/cyber.
Dev nên quan tâm vì
- Coding bench cao nhất hiện tại: Terminal-Bench 2.0 82.7% (vượt xa Opus 4.7 69.4%) đi kèm giá thấp hơn — đảo lộn tính toán chi phí cho ai đang dùng Opus trên Claude Code.
- Long-context thực sự hoạt động: Graphwalks 1M tăng 4.8x so với 5.4 — nếu bạn dùng big context cho codebase analysis, đây là upgrade đáng thử.
- Token-efficient: OpenAI claim model dùng ít token hơn cho cùng task — giảm thực tế chi phí dù sticker price tăng so với 5.4.
- API đợi thêm: nếu infra đang sợ migration, có thời gian test; nhưng nếu dùng ChatGPT/Codex thì đã tận dụng được ngay hôm nay.