Skip to content
tinAI
Go back

Hướng dẫn nhanh về Ollama và Gemma 4 trên Mac mini (Apple Silicon): Tự khởi động, tải trước và duy trì hoạt động

Bài gốc: April 2026 TLDR setup for Ollama + Gemma 4 12B on a Mac mini (Apple Silicon) — auto-start, preload, and keep-alive

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Bài viết này hướng dẫn cài đặt Ollama và Gemma 4 trên Mac mini với Apple Silicon, bao gồm cách tự khởi động, tải trước và duy trì mô hình hoạt động liên tục. Các bước cụ thể từ cài đặt đến kiểm tra và tối ưu hóa nhằm đảm bảo trải nghiệm mượt mà.

Yêu cầu trước khi bắt đầu

Bước 1: Cài đặt Ollama

Cài đặt ứng dụng Ollama trên macOS qua Homebrew cask:

brew install --cask ollama-app

Điều này sẽ cài đặt:

Bước 2: Khởi động Ollama

Chạy lệnh sau để mở ứng dụng Ollama:

open -a Ollama

Sau đó kiểm tra bằng cách:

ollama list

Bước 3: Tải Gemma 4

Kéo Gemma 4 bằng lệnh sau:

ollama pull gemma4

Bước 4: Kiểm tra mô hình

Chạy mô hình để kiểm tra:

ollama run gemma4:latest "Hello, what model are you?"

Kiểm tra sử dụng GPU:

ollama ps

Bước 5: Cấu hình tự khởi động

5a. Ollama App — Mở khi đăng nhập

Kích hoạt Launch at Login trong biểu tượng Ollama trên thanh menu.

5b. Tải trước Gemma 4 khi khởi động

Tạo launch agent để tải mô hình vào bộ nhớ sau khi Ollama khởi động:

cat << 'EOF' > ~/Library/LaunchAgents/com.ollama.preload-gemma4.plist
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
<dict>
    <key>Label</key>
    <string>com.ollama.preload-gemma4</string>
    <key>ProgramArguments</key>
    <array>
        <string>/opt/homebrew/bin/ollama</string>
        <string>run</string>
        <string>gemma4:latest</string>
    </array>
    <key>RunAtLoad</key>
    <true/>
    <key>StartInterval</key>
    <integer>300</integer>
    <key>StandardOutPath</key>
    <string>/tmp/ollama-preload.log</string>
    <key>StandardErrorPath</key>
    <string>/tmp/ollama-preload.log</string>
</dict>
</plist>
EOF

Nạp agent:

launchctl load ~/Library/LaunchAgents/com.ollama.preload-gemma4.plist

5c. Duy trì mô hình

Giữ mô hình luôn trong bộ nhớ:

launchctl setenv OLLAMA_KEEP_ALIVE "-1"

Bước 6: Kiểm tra tổng thể

Kiểm tra trạng thái:

ollama list
ollama ps
launchctl list | grep ollama

Truy cập API

Ollama cung cấp API cục bộ:

curl http://localhost:11434/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma4:latest",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Lệnh hữu ích | Description |

| --- | --- | | ollama list | Liệt kê các mô hình đã tải | | ollama ps | Hiển thị mô hình đang chạy & sử dụng bộ nhớ | | ollama run gemma4:latest | Trò chuyện tương tác | | ollama stop gemma4:latest | Gỡ mô hình khỏi bộ nhớ | | ollama pull gemma4:latest | Cập nhật mô hình lên phiên bản mới nhất | | ollama rm gemma4:latest | Xóa mô hình |

Gỡ cài đặt / Xóa tự động khởi động

launchctl unload ~/Library/LaunchAgents/com.ollama.preload-gemma4.plist
rm ~/Library/LaunchAgents/com.ollama.preload-gemma4.plist
brew uninstall --cask ollama-app

Điều gì mới trong Ollama v0.19+

MLX Backend trên Apple Silicon

Ollama sử dụng framework MLX của Apple cho hiệu suất suy luận nhanh hơn trên Apple Silicon.

Hỗ trợ NVFP4 (NVIDIA)

Ollama hỗ trợ định dạng NVFP4 của NVIDIA để giữ độ chính xác mô hình trong khi giảm băng thông bộ nhớ.

Cải tiến bộ nhớ tạm cho nhiệm vụ lập trình


Read Original (EN) Quay lại Newsletter