Giới thiệu
Hôm nay, chúng tôi giới thiệu Kimi K2.5, mô hình mã nguồn mở mạnh mẽ nhất tính đến nay.
Kimi K2.5 được xây dựng trên nền tảng Kimi K2 với việc tiền huấn luyện thêm khoảng 15 nghìn tỷ token hỗn hợp từ văn bản và hình ảnh. Là một mô hình đa phương tiện tự nhiên, K2.5 cung cấp các khả năng tiên tiến về mã hóa và thị giác cùng với phương thức tác nhân tự chỉ đạo nhóm tác nhân.
Khả năng Tác nhân
Kimi K2.5 có thể tự chỉ đạo một nhóm tác nhân lên tới 100 tác nhân phụ, thực thi các quy trình song song bao gồm 1.500 cuộc gọi công cụ. So với cấu hình tác nhân đơn, điều này giảm thời gian thực thi lên tới 4.5 lần. Nhóm tác nhân được tự động tạo và điều phối bởi Kimi K2.5 mà không cần các tác nhân phụ hoặc quy trình làm việc định trước.
Khả năng Lập trình với Thị giác
Lập trình với Thị giác
Kimi K2.5 là mô hình mã nguồn mở mạnh nhất hiện nay cho lập trình, đặc biệt là trong phát triển giao diện người dùng.
K2.5 có thể biến các cuộc hội thoại đơn giản thành giao diện người dùng hoàn chỉnh, thực hiện bố cục tương tác và hiệu ứng hoạt hình phong phú như hiệu ứng kích hoạt khi cuộn. Dưới đây là một số ví dụ được tạo bởi K2.5 từ một lời nhắc đơn với công cụ tạo hình ảnh:
# Đây là một đoạn mã mẫu minh họa cho cách để thực hiện một hiệu ứng hoạt hình
Ngoài các lời nhắp văn bản, K2.5 xuất sắc trong việc lập trình với thị giác. Bằng cách lý luận qua hình ảnh và video, K2.5 cải thiện việc tạo mã từ hình ảnh/video và sửa lỗi qua hình ảnh, hạ thấp rào cản cho người dùng trong việc thể hiện ý định một cách trực quan.
Tính năng của Nhóm Tác nhân
Nhóm tác nhân
Mở rộng Khả năng Tác nhân. Chúng tôi phát hành K2.5 Agent Swarm như một bản xem trước nghiên cứu, đánh dấu sự chuyển đổi từ mở rộng tác nhân đơn đến thực thi tự chỉ đạo và phối hợp dạng nhóm như bầy đàn.
K2.5 học cách tự chỉ đạo một nhóm tác nhân lên tới 100 tác nhân phụ, thực thi các quy trình làm việc song song trên phạm vi 1.500 bước đồng bộ mà không cần vai trò định sẵn hay quy trình làm việc thủ công.
Kết luận
Dựa trên những tiến bộ trong lập trình với thị giác, nhóm tác nhân, và năng suất văn phòng, Kimi K2.5 đại diện cho một bước tiến quan trọng hướng tới AGI cho cộng đồng mã nguồn mở, thể hiện khả năng mạnh mẽ trong các nhiệm vụ thực tế dưới áp lực thực tế. Nhìn về phía trước, chúng tôi sẽ tiếp tục khám phá vùng biên mới của trí tuệ tác nhân, định nghĩa lại giới hạn của AI trong công việc tri thức.
Phụ lục
Bảng Kiểm tra
Chúng tôi khuyến nghị sử dụng API chính thức để tái tạo các kết quả kiểm tra của Kimi-K2.5. Đối với các nhà cung cấp bên thứ ba, tham khảo Kimi Vendor Verifier (KVV) để lựa chọn các dịch vụ có độ chính xác cao.