Ollama kết hợp với MLX trên Apple Silicon

Bản dịch tiếng Việt của tinAI · Từ Ollama is now powered by MLX on Apple Silicon in preview · Ollama Blog (ollama.com) · Ngày gốc: 2026-04-01 · Dịch ngày: 2026-04-01

Bài gốc: Ollama is now powered by MLX on Apple Silicon in preview · Ollama Blog (ollama.com)

Tác giả: Unknown

Ngày đăng: 2026-04-01 Dịch ngày: 2026-04-01

TL;DR

Ollama hiện đã sử dụng framework MLX của Apple để cải thiện hiệu suất trên vi xử lý Apple Silicon. Điều này giúp tăng tốc độ xử lý cho các tác vụ AI như trợ lý cá nhân và tác vụ mã hóa.

Ước tính đọc: 1 phút

Giới thiệu

Hôm nay, Ollama giới thiệu bản thử nghiệm chạy trên Apple silicon kết hợp với MLX, framework máy học của Apple. Điều này mở ra hiệu suất mới cho các tác vụ đòi hỏi cao trên macOS.

Tính năng chính

Hiệu suất tối đa trên Apple silicon với MLX: Ollama sử dụng kiến trúc bộ nhớ thống nhất của Apple thông qua MLX để tăng tốc độ đáng kể trên tất cả các thiết bị Apple Silicon.
Hỗ trợ NVFP4: Ollama sử dụng định dạng NVFP4 của NVIDIA để duy trì độ chính xác của mô hình trong khi giảm yêu cầu băng thông bộ nhớ và lưu trữ.
Cải tiến caching: Cache của Ollama được nâng cấp để giảm sử dụng bộ nhớ và tăng phản hồi nhanh hơn khi thực hiện các tác vụ mã hóa.

Cách sử dụng

Claude Code:

ollama launch claude --model qwen3.5:35b-a3b-coding-nvfp4

OpenClaw:

ollama launch openclaw --model qwen3.5:35b-a3b-coding-nvfp4

Trò chuyện với mô hình:
```
ollama run qwen3.5:35b-a3b-coding-nvfp4
```

Ollama kết hợp với MLX trên Apple Silicon

TL;DR

Giới thiệu

Tính năng chính

Cách sử dụng

Đường dẫn nguồn

Cùng bản tin này