Skip to content
tinAI
Go back

GitHub - arman-bd/guppylm: Một mô hình LLM với 9 triệu tham số nói như cá nhỏ

Bài gốc: GitHub - arman-bd/guppylm: A ~9M parameter LLM that talks like a small fish.

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

GuppyLM là một mô hình ngôn ngữ nhỏ 9 triệu tham số, được huấn luyện để nói như một con cá. Mô hình hướng dẫn bạn cách tự tạo mô hình ngôn ngữ mà không cần chuyên sâu về kỹ thuật.

Giới thiệu về GuppyLM

GuppyLM là một mô hình ngôn ngữ nhỏ (~9 triệu tham số) mô phỏng con cá tên Guppy. Mô hình sử dụng các câu ngắn, chữ thường và nói về chủ đề liên quan đến nước, thức ăn, và cuộc sống trong bể nuôi.

Kiến trúc

Mô hình sử dụng cấu trúc transformer cơ bản.

Tính cách của Guppy

Bắt đầu nhanh

Thử dùng trong trình duyệt

Chạy hoàn toàn trong trình duyệt thông qua WebAssembly, không cần cài đặt gì thêm.

Trò chuyện với Guppy trên Colab

Tải mô hình từ HuggingFace và thực hiện giao tiếp qua Colab.

Huấn luyện mô hình của bạn

  1. Thiết lập runtime GPU T4
  2. Chạy tất cả các cell để tải dataset, huấn luyện tokenizer và mô hình

Trò chuyện cục bộ

Cài đặt và chạy mô hình dựa trên máy cục bộ:

pip install torch tokenizers
python -m guppylm chat

Cấu trúc dự án

guppylm/
├── config.py               # Hyperparameters (model + training)
├── model.py                # Transformer cơ bản
├── dataset.py              # Tải và xử lý dữ liệu
├── train.py                # Vòng lặp huấn luyện

Quyết định thiết kế

Giấy phép

MIT


Read Original (EN) Quay lại Newsletter