Giới thiệu về Agent Mã Nguồn Mở
Trong năm qua, các agent mã đã thay đổi cách mà nhà phát triển viết, kiểm thử, và duy trì phần mềm. Tuy nhiên, hầu hết các agent đều có các hạn chế: chúng đóng, đắt để huấn luyện và khó thích ứng với mã riêng tư.
Agent Mã Nguồn Mở của Ai2 giải quyết điều đó. Chúng tôi không chỉ phát hành các mô hình mã mạnh mẽ mà còn là phương pháp huấn luyện giúp tạo ra agent mã cho bất kỳ mã nào một cách dễ dàng.
Thách thức
Các mô hình đóng không thể thấy mã nội bộ, vì vậy không thể biết các API nội bộ, hay quy ước của tổ chức. Huấn luyện trên dữ liệu riêng tư giúp hiểu rõ hơn, nhưng việc tạo dữ liệu huấn luyện từ mã riêng tư rất khó khăn và tốn kém.
Giải pháp của Ai2
Chúng tôi đã tối ưu hóa mọi giai đoạn để tối đa hóa hiệu quả, từ chất lượng dữ liệu đến chi phí suy luận.
SERA: Family Open Coding Agents
Phiên bản đầu tiên là SERA (Soft-verified Efficient Repository Agents). Mô hình mạnh nhất, SERA-32B, vượt qua các mô hình mã nguồn mở trước đó, chỉ cần 40 ngày GPU để huấn luyện.
Hợp tác với NVIDIA
Chúng tôi đã cộng tác với NVIDIA để tối ưu hóa suy luận của SERA, đảm bảo hiệu suất tối đa trong môi trường sản xuất. Các thử nghiệm sớm rất hứa hẹn.
Cách tiếp cận mới: SVG
- Soft-verified generation (SVG): Thế hệ dữ liệu huấn luyện tổng hợp không cần chính xác hoàn toàn nhưng vẫn hữu ích.
- Scaling with a bug-type menu: Sử dụng đa dạng mẫu lỗi để tạo dữ liệu huấn luyện.
- High simulated workflow fidelity: Mô phỏng quy trình làm việc của nhà phát triển thay vì chi tiết mã chính xác.
Hiệu suất đỉnh cao, phần cứng dễ tiếp cận
Chúng tôi đã phát triển một loạt các mô hình từ 8B đến 32B tham số. Phương pháp của chúng tôi rẻ và khả thi để chạy và tùy chỉnh.
Dành cho nhà phát triển và nhà nghiên cứu
Gói phát hành của chúng tôi bao gồm mọi thứ cần thiết để tái tạo, thử nghiệm và xây dựng trên SERA một cách dễ dàng.
Models | Tech Report | SERA CLI | CLI on PyPi