Mô hình nguồn mở Qwen3.5 của Alibaba đạt hiệu suất gần Sonnet 4.5 trên máy tính cục bộ

Bản dịch tiếng Việt của tinAI · Từ Alibaba's new open source Qwen3.5 Medium model offers near Sonnet 4.5 performance on local computers (venturebeat.com) · Ngày gốc: 2026-02-26 · Dịch ngày: 2026-03-01

Bài gốc: Alibaba's new open source Qwen3.5 Medium model offers near Sonnet 4.5 performance on local computers (venturebeat.com)

Tác giả: Unknown

Ngày đăng: 2026-02-26 Dịch ngày: 2026-03-01

TL;DR

Alibaba đã phát hành Qwen3.5 Medium, đem lại hiệu suất gần tương đương với Sonnet 4.5 mà không cần hạ tầng máy chủ lớn. Đây là bước tiến quan trọng cho developer vì có thể triển khai trên máy tính cá nhân với hiệu quả cao.

Ước tính đọc: 2 phút

Giới thiệu

Đội ngũ phát triển AI của Alibaba vừa ra mắt dòng mô hình Qwen3.5 Medium với bốn ngôn ngữ mô hình mới hỗ trợ gọi hàm công cụ. Ba mô hình được cấp phép mở Apache 2.0 cho các doanh nghiệp và developer độc lập:

Qwen3.5-35B-A3B
Qwen3.5-122B-A10B
Qwen3.5-27B

Những mô hình này có thể tải xuống từ Hugging Face và ModelScope. Mô hình thứ tư, Qwen3.5-Flash, vẫn thuộc quyền sở hữu và chỉ có qua API của Alibaba Cloud Model Studio.

Tính năng chính

Hiệu suất cao: Có thể sánh với các mô hình độc quyền từ OpenAI hay Anthropic, thậm chí vượt qua GPT-5-mini và Sonnet 4.5.
Quan trọng cho Dev: Hỗ trợ ngữ cảnh dài hơn một triệu token trên GPU tiêu dùng với 32GB VRAM, nhờ quy trình lượng hóa 4-bit gần như mất mát thấp.
Kiến trúc lai: Sử dụng Gated Delta Networks và hệ thống Mixture-of-Experts (MoE) để giảm độ trễ mà không ảnh hưởng đến hiệu suất.

Cách sử dụng

Qwen3.5-27B: Dành cho hiệu suất cao với chiều dài ngữ cảnh trên 800K token.
Qwen3.5-Flash: Phiên bản host sẵn, hỗ trợ công cụ chính thức.
Qwen3.5-122B-A10B: Dành cho GPU cấp máy chủ (80GB VRAM) với hơn một triệu token.

Những kết quả benchmark đã xác nhận sự cải tiến về kiến trúc này vượt trội hơn các mô hình trước.

Ý nghĩa cho lãnh đạo doanh nghiệp

Việc phát hành Qwen3.5 Medium Models cho phép phát triển nội bộ mà không cần đầu tư lớn, đồng thời bảo mật dữ liệu khỏi rủi ro của API bên thứ ba.