Giới thiệu
Hôm nay, Ollama giới thiệu bản thử nghiệm chạy trên Apple silicon kết hợp với MLX, framework máy học của Apple. Điều này mở ra hiệu suất mới cho các tác vụ đòi hỏi cao trên macOS.
Tính năng chính
- Hiệu suất tối đa trên Apple silicon với MLX: Ollama sử dụng kiến trúc bộ nhớ thống nhất của Apple thông qua MLX để tăng tốc độ đáng kể trên tất cả các thiết bị Apple Silicon.
- Hỗ trợ NVFP4: Ollama sử dụng định dạng NVFP4 của NVIDIA để duy trì độ chính xác của mô hình trong khi giảm yêu cầu băng thông bộ nhớ và lưu trữ.
- Cải tiến caching: Cache của Ollama được nâng cấp để giảm sử dụng bộ nhớ và tăng phản hồi nhanh hơn khi thực hiện các tác vụ mã hóa.
Cách sử dụng
- Claude Code:
ollama launch claude --model qwen3.5:35b-a3b-coding-nvfp4 - OpenClaw:
ollama launch openclaw --model qwen3.5:35b-a3b-coding-nvfp4 - Trò chuyện với mô hình:
ollama run qwen3.5:35b-a3b-coding-nvfp4