Skip to content
tinAI
Go back

Google Gemma 4 Chạy Native Trên iPhone: Kỷ Nguyên AI Offline Đã Đến

Bài gốc: Google Gemma 4 Runs Natively on iPhone With Full Offline AI Inference

Tác giả: jerrywanint

Ngày đăng: Dịch ngày:

TL;DR

Google Gemma 4 giờ chạy hoàn toàn offline trên iPhone qua app Google AI Edge Gallery — không cần API key, không cần cloud. Các model nhỏ E2B và E4B được tối ưu cho mobile, inference route qua GPU iPhone với latency thấp đáng kể.

Giới thiệu

Google Gemma 4 — dòng open-source model của Google — giờ chạy được trực tiếp trên iPhone với full local inference, không cần kết nối mạng. Đây không phải demo lab: inference thực sự route qua GPU của iPhone và response latency thấp đến mức bất ngờ với hardware consumer.

Các biến thể model

Gemma 4 có nhiều kích cỡ cho các use case khác nhau:

Google rõ ràng hướng người dùng về E2B vì lý do thực tế: consumer hardware có giới hạn nhiệt và RAM, E2B ổn định hơn trong production.

Cách bắt đầu

  1. Tải Google AI Edge Gallery từ App Store
  2. Chọn model variant phù hợp
  3. Chạy inference ngay trên thiết bị — không cần API call, không cần cloud

Không có setup phức tạp. Không có API key. Không có chi phí per-request.

App không chỉ là text interface đơn thuần:

Ý nghĩa với dev

Offline capability thay đổi tính toán cho nhiều use case cụ thể:

Nếu bạn đang build mobile app cần AI mà không muốn phụ thuộc cloud, đây là thời điểm nghiêm túc evaluate on-device inference.


Read Original (EN) Quay lại Newsletter