Skip to content
tinAI
Go back

GitHub - t8/hypura: Chạy mô hình quá lớn cho bộ nhớ Mac của bạn

Bài gốc: GitHub - t8/hypura: Run models too big for your Mac's memory

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Hypura là một công cụ cho phép chạy các mô hình AI lớn trên máy Mac sử dụng kiến trúc Apple Silicon, tối ưu hoá việc phân bổ tài nguyên để tránh làm hệ thống bị sập.

Giới thiệu Hypura

Hypura là một công cụ dành cho Apple Silicon, giúp chạy các mô hình AI lớn không vừa bộ nhớ vật lý của máy. Nó phân bổ tensors của mô hình trên GPU, RAM, và NVMe dựa trên mô hình truy cập, chi phí băng thông, và khả năng phần cứng.

Tại sao Hypura quan trọng?

Máy Mac tiêu chuẩn thường có bộ nhớ nhỏ so với kích thước mô hình AI. Hypura giải quyết vấn đề này bằng cách thông minh phân bổ tài nguyên:

Cách hoạt động

Hypura đọc file GGUF, tối ưu hóa sự phân bổ cho từng tensor, tự động chọn chế độ suy diễn tốt nhất:

Hiệu suất

Trên máy M1 Max với 32 GB bộ nhớ:

Cài đặt

Cài từ source với Cargo (cần Rust 1.75+ và CMake).

 git clone --recurse-submodules https://github.com/hypura/hypura.git
 cd hypura
 cargo build --release

Khởi đầu nhanh

 hypura profile # Chỉ chạy một lần
 hypura run ./model.gguf --prompt "Hello, world"
 hypura run ./model.gguf --interactive

API tương thích Ollama

Hypura hỗ trợ API HTTP chuẩn Ollama, tiện cho các công cụ tương tác như OpenClaw.

 hypura serve ./model.gguf

Kiến trúc

Hypura tổ chức thành workspace Cargo với hai phần chính:

FAQ

Hypura có gây hỏng SSD?

Không, Hypura chỉ đọc từ SSD trong quá trình suy diễn, không ghi dữ liệu.

Giấy phép

Hypura được phát hành theo giấy phép MIT.


Read Original (EN) Quay lại Newsletter