Skip to content
tinAI
Go back

GitHub - karpathy/autoresearch: AI tự động nghiên cứu với đào tạo nanochat trên một GPU

Bài gốc: GitHub - karpathy/autoresearch: AI agents running research on single-GPU nanochat training automatically

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Repository này cho phép AI tự động thử nghiệm các mô hình LLM trên một thiết lập GPU đơn giản qua đêm. Dự án tập trung vào việc cho phép các agent tự điều chỉnh và thử nghiệm để cải thiện mô hình mà không cần sự can thiệp của con người.

Giới thiệu

Teaser Image

Trong quá khứ, nghiên cứu AI được thực hiện bởi con người. Tuy nhiên, giờ đây các tác vụ nghiên cứu hoàn toàn do các AI agent thực hiện. Dự án này chia sẻ cách nó bắt đầu.

Ý tưởng là cung cấp cho một AI agent một thiết lập đào tạo LLM nhỏ và cho phép nó tự động thử nghiệm qua đêm. Nó sẽ điều chỉnh mã, đào tạo trong 5 phút, kiểm tra kết quả và tiếp tục hoặc hủy bỏ dựa trên cải thiện.

Chi tiết hoạt động

Repository này chỉ có ba tệp chính:

Giới hạn thời gian đào tạo là 5 phút để đảm bảo tính so sánh giữa các lần thử.

Bắt đầu

Yêu cầu Cấu hình: Một NVIDIA GPU, Python 3.10+, uv.

# 1. Cài đặt uv project manager
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. Cài đặt dependencies
uv sync

# 3. Tải dữ liệu và huấn luyện tokenizer
uv run prepare.py

# 4. Thử nghiệm đào tạo đơn
uv run train.py

Các lựa chọn thiết kế

Ghi chú

License

Repository này theo giấy phép MIT.


Read Original (EN) Quay lại Newsletter