Skip to content
tinAI
Go back

Qwen3.6-35B-A3B: Model agentic coding mã nguồn mở, chạy được trên laptop

Bài gốc: Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All

Tác giả: Qwen Team

Ngày đăng: Dịch ngày:

TL;DR

Qwen3.6-35B-A3B là MoE model 35B tổng tham số nhưng chỉ activate 3B khi inference — tức là chạy được local mà không cần cloud GPU. Hiệu suất coding cạnh tranh với Claude Sonnet và Qwen3.5-27B dense. Fully open source, có thể dùng với Claude Code qua Anthropic-compatible API.

Giới thiệu

Qwen3.6-35B-A3B là MoE (Mixture of Experts) model mã nguồn mở từ Alibaba, với 35 tỷ tổng tham số nhưng chỉ kích hoạt 3 tỷ khi inference. Kiến trúc này cho phép chạy trên máy cá nhân mà hiệu suất ngang dense model lớn hơn nhiều lần.

Model hỗ trợ cả văn bản và hình ảnh (natively multimodal), và có cả chế độ thinking và non-thinking.

Hiệu suất

Coding và agentic tasks

BenchmarkQwen3.6-35B-A3BQwen3.5-27B (dense)Qwen3.5-35B-A3B
SWE-bench Verified73.4%75.0%70.0%
Terminal-Bench 2.051.5%41.6%40.5%
AIME 202692.7%92.6%91.0%
MCPMark37.036.327.0

Nổi bật nhất là Terminal-Bench 2.0 — tăng 11 điểm so với người tiền nhiệm Qwen3.5-35B-A3B.

Vision

Trên nhiều vision benchmark, Qwen3.6-35B-A3B ngang bằng Claude Sonnet 4.5 và vượt trội ở spatial intelligence:

Cách sử dụng

Tải về tự host

# Hugging Face
huggingface-cli download Qwen/Qwen3.6-35B-A3B

# ModelScope
modelscope download Qwen/Qwen3.6-35B-A3B

API (OpenAI-compatible)

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3.6-flash",  # API name
    messages=[{"role": "user", "content": "Review this code..."}],
    extra_body={"enable_thinking": True},  # bật thinking mode
    stream=True
)

Lưu ý: Dùng preserve_thinking: true cho agentic tasks để giữ reasoning context qua các turns.

Dùng với Claude Code

Qwen hỗ trợ Anthropic-compatible API, cho phép dùng trực tiếp với Claude Code:

export ANTHROPIC_MODEL="qwen3.6-flash"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-flash"
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=<your_api_key>
claude

Tổng kết

Qwen3.6-35B-A3B là lựa chọn tốt nhất hiện tại nếu bạn muốn:

Model đang live trên Qwen Studio, HuggingFace, ModelScope, và Alibaba Cloud API (coming soon).


Read Original (EN) Quay lại Newsletter