Có gì mới
Sau khi ra mắt Qwen3.6-Plus, Qwen team giới thiệu preview của model proprietary tiếp theo: Qwen3.6-Max-Preview. So với Qwen3.6-Plus, bản preview này mang lại:
- World knowledge và instruction following mạnh hơn
- Cải thiện đáng kể ở agentic coding trên nhiều benchmark
- Real-world agent và knowledge reliability tốt hơn
Đây là hosted proprietary model, available qua Alibaba Cloud Model Studio. Là preview nên model vẫn đang được iterate tiếp — Qwen team expect sẽ có thêm cải tiến ở các version sau.
Hiệu năng
Qwen3.6-Max-Preview đạt top score trên 6 benchmark coding lớn:
- SWE-bench Pro
- Terminal-Bench 2.0
- SkillsBench
- QwenClawBench
- QwenWebBench
- SciCode
So với Qwen3.6-Plus, các improvement cụ thể:
- SkillsBench: +9.9
- SciCode: +6.3
- NL2Repo: +5.0
- Terminal-Bench 2.0: +3.8
- SuperGPQA: +2.3
- QwenChineseBench: +5.3
- ToolcallFormatIFBench: +2.8 (instruction following)
Cách sử dụng
Model available qua Alibaba Cloud Model Studio API với tên qwen3.6-max-preview. Bạn cũng có thể chat trực tiếp tại Qwen Studio (chat.qwen.ai).
Alibaba Cloud Model Studio hỗ trợ industry-standard protocols: chat completions và responses API tương thích OpenAI spec, cùng với API tương thích Anthropic.
Tính năng preserve_thinking
Release này support preserve_thinking — giữ lại thinking content từ tất cả preceding turns trong messages. Qwen team khuyến nghị bật tính năng này cho agentic tasks.
Code example (Python, OpenAI-compatible)
from openai import OpenAI
import os
api_key = os.environ.get("DASHSCOPE_API_KEY")
if not api_key:
raise ValueError("DASHSCOPE_API_KEY is required")
client = OpenAI(
api_key=api_key,
base_url=os.environ.get(
"DASHSCOPE_BASE_URL",
"https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
),
)
messages = [{"role": "user", "content": "Introduce vibe coding."}]
completion = client.chat.completions.create(
model="qwen3.6-max-preview",
messages=messages,
extra_body={
"enable_thinking": True,
# "preserve_thinking": True,
},
stream=True,
)
for chunk in completion:
delta = chunk.choices[0].delta
if hasattr(delta, "reasoning_content") and delta.reasoning_content:
print(delta.reasoning_content, end="", flush=True)
if hasattr(delta, "content") and delta.content:
print(delta.content, end="", flush=True)
Các base URL theo region
- Beijing:
https://dashscope.aliyuncs.com/compatible-mode/v1 - Singapore:
https://dashscope-intl.aliyuncs.com/compatible-mode/v1 - US (Virginia):
https://dashscope-us.aliyuncs.com/compatible-mode/v1
Dev nên quan tâm vì
Nếu bạn đang dùng Claude hoặc GPT cho agentic coding workflows, việc model này có API tương thích OpenAI/Anthropic spec nghĩa là bạn có thể test drop-in replacement gần như không cần sửa code. Điểm mạnh nhất là agentic coding (SWE-bench Pro, Terminal-Bench) — đây là area mà devs dùng LLMs thực sự nhiều nhất hiện nay.