Qwen3.6-Max-Preview: Thông minh hơn, sắc bén hơn, vẫn đang tiến hóa

Có gì mới

Sau khi ra mắt Qwen3.6-Plus, Qwen team giới thiệu preview của model proprietary tiếp theo: Qwen3.6-Max-Preview. So với Qwen3.6-Plus, bản preview này mang lại:

World knowledge và instruction following mạnh hơn
Cải thiện đáng kể ở agentic coding trên nhiều benchmark
Real-world agent và knowledge reliability tốt hơn

Đây là hosted proprietary model, available qua Alibaba Cloud Model Studio. Là preview nên model vẫn đang được iterate tiếp — Qwen team expect sẽ có thêm cải tiến ở các version sau.

Hiệu năng

Qwen3.6-Max-Preview đạt top score trên 6 benchmark coding lớn:

SWE-bench Pro
Terminal-Bench 2.0
SkillsBench
QwenClawBench
QwenWebBench
SciCode

So với Qwen3.6-Plus, các improvement cụ thể:

SkillsBench: +9.9
SciCode: +6.3
NL2Repo: +5.0
Terminal-Bench 2.0: +3.8
SuperGPQA: +2.3
QwenChineseBench: +5.3
ToolcallFormatIFBench: +2.8 (instruction following)

Cách sử dụng

Model available qua Alibaba Cloud Model Studio API với tên qwen3.6-max-preview. Bạn cũng có thể chat trực tiếp tại Qwen Studio (chat.qwen.ai).

Alibaba Cloud Model Studio hỗ trợ industry-standard protocols: chat completions và responses API tương thích OpenAI spec, cùng với API tương thích Anthropic.

Tính năng `preserve_thinking`

Release này support preserve_thinking — giữ lại thinking content từ tất cả preceding turns trong messages. Qwen team khuyến nghị bật tính năng này cho agentic tasks.

Code example (Python, OpenAI-compatible)

from openai import OpenAI
import os

api_key = os.environ.get("DASHSCOPE_API_KEY")
if not api_key:
    raise ValueError("DASHSCOPE_API_KEY is required")

client = OpenAI(
    api_key=api_key,
    base_url=os.environ.get(
        "DASHSCOPE_BASE_URL",
        "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
    ),
)

messages = [{"role": "user", "content": "Introduce vibe coding."}]

completion = client.chat.completions.create(
    model="qwen3.6-max-preview",
    messages=messages,
    extra_body={
        "enable_thinking": True,
        # "preserve_thinking": True,
    },
    stream=True,
)

for chunk in completion:
    delta = chunk.choices[0].delta
    if hasattr(delta, "reasoning_content") and delta.reasoning_content:
        print(delta.reasoning_content, end="", flush=True)
    if hasattr(delta, "content") and delta.content:
        print(delta.content, end="", flush=True)

Các base URL theo region

Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1
Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1

Dev nên quan tâm vì

Nếu bạn đang dùng Claude hoặc GPT cho agentic coding workflows, việc model này có API tương thích OpenAI/Anthropic spec nghĩa là bạn có thể test drop-in replacement gần như không cần sửa code. Điểm mạnh nhất là agentic coding (SWE-bench Pro, Terminal-Bench) — đây là area mà devs dùng LLMs thực sự nhiều nhất hiện nay.

Qwen3.6-Max-Preview: Thông minh hơn, sắc bén hơn, vẫn đang tiến hóa

TL;DR

Có gì mới

Hiệu năng

Cách sử dụng

Tính năng `preserve_thinking`

Code example (Python, OpenAI-compatible)

Các base URL theo region

Dev nên quan tâm vì

Đường dẫn nguồn

Qwen3.6-Max-Preview: Thông minh hơn, sắc bén hơn, vẫn đang tiến hóa

TL;DR

Có gì mới

Hiệu năng

Cách sử dụng

Tính năng preserve_thinking

Code example (Python, OpenAI-compatible)

Các base URL theo region

Dev nên quan tâm vì

Đường dẫn nguồn

Cùng bản tin này

Tính năng `preserve_thinking`