Giới thiệu
Đội ngũ phát triển AI của Alibaba vừa ra mắt dòng mô hình Qwen3.5 Medium với bốn ngôn ngữ mô hình mới hỗ trợ gọi hàm công cụ. Ba mô hình được cấp phép mở Apache 2.0 cho các doanh nghiệp và developer độc lập:
- Qwen3.5-35B-A3B
- Qwen3.5-122B-A10B
- Qwen3.5-27B
Những mô hình này có thể tải xuống từ Hugging Face và ModelScope. Mô hình thứ tư, Qwen3.5-Flash, vẫn thuộc quyền sở hữu và chỉ có qua API của Alibaba Cloud Model Studio.
Tính năng chính
- Hiệu suất cao: Có thể sánh với các mô hình độc quyền từ OpenAI hay Anthropic, thậm chí vượt qua GPT-5-mini và Sonnet 4.5.
- Quan trọng cho Dev: Hỗ trợ ngữ cảnh dài hơn một triệu token trên GPU tiêu dùng với 32GB VRAM, nhờ quy trình lượng hóa 4-bit gần như mất mát thấp.
- Kiến trúc lai: Sử dụng Gated Delta Networks và hệ thống Mixture-of-Experts (MoE) để giảm độ trễ mà không ảnh hưởng đến hiệu suất.
Cách sử dụng
- Qwen3.5-27B: Dành cho hiệu suất cao với chiều dài ngữ cảnh trên 800K token.
- Qwen3.5-Flash: Phiên bản host sẵn, hỗ trợ công cụ chính thức.
- Qwen3.5-122B-A10B: Dành cho GPU cấp máy chủ (80GB VRAM) với hơn một triệu token.
Những kết quả benchmark đã xác nhận sự cải tiến về kiến trúc này vượt trội hơn các mô hình trước.
Ý nghĩa cho lãnh đạo doanh nghiệp
Việc phát hành Qwen3.5 Medium Models cho phép phát triển nội bộ mà không cần đầu tư lớn, đồng thời bảo mật dữ liệu khỏi rủi ro của API bên thứ ba.