Skip to content
tinAI
Go back

GitHub - arman-bd/guppylm: Mô hình LLM 9 triệu tham số nói như cá nhỏ

Bài gốc: GitHub - arman-bd/guppylm: A ~9M parameter LLM that talks like a small fish.

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

GuppyLM là một mô hình ngôn ngữ nhỏ với khoảng 9 triệu tham số, được huấn luyện để nói như một con cá. Dự án này hướng dẫn cách tạo một mô hình ngôn ngữ mà không cần kiến thức sâu rộng hoặc phần cứng mạnh mẽ — chỉ cần một notebook Colab và vài phút.

Giới thiệu về GuppyLM

GuppyLM là một mô hình ngôn ngữ nhỏ, được tạo ra để nói như một con cá tên Guppy. Mô hình này sử dụng khoảng 9 triệu tham số và có thể chạy trong trình duyệt. GuppyLM nói về nước, thức ăn, ánh sáng, và cuộc sống trong bể.

Cấu trúc

Tính cách của Guppy

60 chủ đề: chào hỏi, cảm xúc, nhiệt độ, thức ăn, ánh sáng, nước, bể, tiếng ồn, bong bóng, màu sắc, thực vật, và hơn nữa.

Bắt đầu nhanh

Thử trên trình duyệt

Chạy hoàn toàn trên trình duyệt qua WebAssembly. Tải về một mô hình ONNX (~10 MB) và chạy inference nội bộ.

Trò chuyện với Guppy trên Colab

Open in Colab

Tự huấn luyện

  1. Chọn runtime T4 GPU
  2. Chạy tất cả cell — tải dataset, huấn luyện tokenizer, huấn luyện mô hình, kiểm tra.

Cấu trúc dự án

gu...lm/
|- config.py
|- model.py
|- dataset.py
|- train.py
|- generate_data.py
|- eval_cases.py
|- prepare_data.py
|- inference.py

Quyết định thiết kế

Giấy phép

MIT


Read Original (EN) Quay lại Newsletter