Skip to content
tinAI
Go back

GLM-5: Từ Lập Trình Cảm Hứng đến Kỹ Thuật Đại Diện

Bài gốc: GLM-5: From Vibe Coding to Agentic Engineering

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

GLM-5 ra mắt với khả năng xử lý hệ thống phức tạp và tác vụ đại diện dài hạn, mở rộng lên 744B tham số. Nó cải thiện hiệu suất so với phiên bản trước và đứng đầu trong các mô hình mã nguồn mở cho nhiệm vụ tư duy và lập trình.

GLM-5: Từ Lập Trình Cảm Hứng đến Kỹ Thuật Đại Diện

Giới thiệu

Chúng tôi ra mắt GLM-5 nhắm đến kỹ thuật hệ thống phức tạp và nhiệm vụ đại diện dài hạn. Việc mở rộng là một trong những cách quan trọng để nâng cao hiệu quả thông minh của Trí Tuệ Nhân Tạo Tổng Quát (AGI). So với GLM-4.5, GLM-5 mở rộng từ 355B tham số (32B hoạt động) lên 744B tham số (40B hoạt động), và tăng dữ liệu tiền huấn luyện từ 23T lên 28.5T token. GLM-5 cũng tích hợp DeepSeek Sparse Attention (DSA), giảm đáng kể chi phí triển khai trong khi bảo toàn khả năng xử lý ngữ cảnh dài.

Học Tăng Cường

Học tăng cường nhằm thu hẹp khoảng cách giữa khả năng và xuất sắc trong các mô hình tiền huấn luyện. Việc triển khai trên quy mô lớn cho LLMs gặp nhiều thách thức do sự không hiệu quả trong huấn luyện RL. Để giải quyết, chúng tôi đã phát triển slime, một hạ tầng RL không đồng bộ cải thiện đáng kể khả năng huấn luyện, cho phép các lần lặp sau huấn luyện chi tiết hơn.

Hiệu Suất và Đánh Giá

GLM-5 cải thiện đáng kể so với GLM-4.7 qua nhiều tiêu chuẩn học thuật và đạt hiệu suất hàng đầu thế giới trong nhiệm vụ suy luận, lập trình và đại diện.

CC-Bench-V2

Trên bộ đánh giá nội bộ của chúng tôi, GLM-5 vượt trội so với GLM-4.7 ở các nhiệm vụ frontend, backend và dài hạn, thu hẹp khoảng cách với Claude Opus 4.5.

Vending Bench 2

Trên Vending Bench 2, một tiêu chuẩn đo khả năng hoạt động dài hạn, GLM-5 xếp hạng #1 trong các mô hình mã nguồn mở.

Image

Mở Rộng Sử Dụng và Triển Khai

GLM-5 được mở mã nguồn trên Hugging FaceModelScope, với model weights phát hành dưới giấy phép MIT.

Tích Hợp và Triển Khai

Chế Độ và Ứng Dụng

GLM-5 có sẵn trên Z.ai, hỗ trợ chế độ Chat và Agent với công cụ đa năng tạo ra tài liệu thực tế.

Kết Luận

GLM-5 không chỉ nâng cao khả năng kỹ thuật hệ thống phức tạp và đại diện dài hạn mà còn cung cấp các giải pháp mô hình mã nguồn mở hàng đầu cho nhiều thách thức thực tế.


Read Original (EN) Quay lại Newsletter