Skip to content
tinAI
Go back

GitHub - kessler/gemma-gem: Gemma Gem chạy mô hình Gemma 4 của Google hoàn toàn trên thiết bị qua WebGPU

Bài gốc: GitHub - kessler/gemma-gem: Gemma Gem runs Google's Gemma 4 model entirely on-device via WebGPU — no API keys, no cloud, no data leaving your machine.

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Gemma Gem là trợ lý AI cá nhân chạy hoàn toàn trên trình duyệt với mô hình Gemma 4 của Google. Không cần khóa API, không sử dụng đám mây và không có dữ liệu rời khỏi máy của bạn. Hỗ trợ đọc trang, nhấp chuột, điền vào form và nhiều hoạt động khác.

Tổng Quan Gemma Gem

Gemma Gem là trợ lý AI cá nhân sống ngay trong trình duyệt của bạn. Nó chạy mô hình Gemma 4 của Google hoàn toàn trên thiết bị với WebGPU — không cần khóa API, không sử dụng đám mây và không có dữ liệu rời khỏi máy của bạn. Có thể đọc trang, nhấp chuột, điền vào form, chạy JavaScript và trả lời câu hỏi về bất kỳ trang web nào bạn ghé thăm.

Yêu Cầu

Cài Đặt

pnpm install
pnpm build

Tải tiện ích mở rộng trong chrome://extensions (chế độ nhà phát triển) từ .output/chrome-mv3-dev/.

Sử Dụng

  1. Truy cập bất kỳ trang nào.
  2. Nhấp vào biểu tượng viên ngọc (góc dưới bên phải) để mở chat.
  3. Đợi mô hình tải (hiển thị tiến độ trên biểu tượng + chat).
  4. Đặt câu hỏi về trang hoặc yêu cầu thực hiện hành động.

Kiến Trúc

Offscreen Document          Service Worker           Content Script
(Gemma 4 + Agent Loop)  <-> (Message Router)    <-> (Chat UI + DOM Tools)
       |                         |
  WebGPU inference          Screenshot capture
  Token streaming           JS execution

Công Cụ

ToolDescriptionRuns in
read_page_contentĐọc văn bản/HTML của trang hoặc một CSS selectorContent script
take_screenshotChụp trang hiển thị dưới dạng PNGService worker
click_elementNhấp vào một element thông qua CSS selectorContent script
type_textNhập vào input qua CSS selectorContent script
scroll_pageCuộn lên/xuống theo pixelContent script
run_javascriptThực thi JS trong ngữ cảnh trang với đầy đủ truy cập DOMService worker

Cài Đặt

Nhấp vào biểu tượng bánh răng trong đầu chat:

Phát Triển

pnpm build              # Build phát triển (với logging, source maps)
pnpm build:prod         # Build sản phẩm (logging tắt, minified)

Công Nghệ Sử Dụng

Ghi Chú

Thư mục agent/ không có bất kỳ phụ thuộc nào. Nó định nghĩa các giao diện (ModelBackend, ToolExecutor) và có thể được chiết xuất thành một thư viện độc lập.

Giới Thiệu

Gemma Gem chạy mô hình Gemma 4 của Google hoàn toàn trên thiết bị qua WebGPU — không cần khóa API, không sử dụng đám mây, không có dữ liệu rời khỏi máy của bạn.


Read Original (EN) Quay lại Newsletter