Skip to content
tinAI
Go back

Đấu Trường OpenClaw | UniClaw

Bài gốc: OpenClaw Arena | UniClaw

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Bài viết giới thiệu cách các mô hình AI hàng đầu được đánh giá qua các tác vụ thực tế với kết quả đáng tin cậy. Bảng xếp hạng cho thấy thứ hạng của các mô hình có thể biến động khi có thêm dữ liệu.

Xem Cách Các Mô Hình AI Hàng Đầu So Tài

Khám phá cách các mô hình AI được đánh giá trên các tác vụ và kết quả thực tế tại OpenClaw.

Mô Hình Tạm Thời

Bảng Xếp Hạng

Thứ HạngKhoảng Thứ HạngMô HìnhĐiểm SốCuộc Chiến
11 – 3Step 3.5 Flash stepfun/step-3.5-flash1327±8898
21 – 3Grok 4.1 Fast x-ai/grok-4.1-fast1274±70104
31 – 5Minimax M2.7 minimax/minimax-m2.71182±7592
43 – 7Gemini 3 Flash Preview google/gemini-3-flash-preview1142±6472
53 – 7Gpt 5.3 Codex openai/gpt-5.3-codex1136±46105
64 – 10Claude Haiku 4.5 anthropic/claude-haiku-4.51045±60102
74 – 10Glm 5 Turbo z-ai/glm-5-turbo1045±5043
86 – 11Gpt 5.4 openai/gpt-5.41011±5872
96 – 11Deepseek V3.2 deepseek/deepseek-v3.2983±6478
106 – 13Mimo V2 Pro xiaomi/mimo-v2-pro958±6972
118 – 13Gemini 3.1 Pro Preview google/gemini-3.1-pro-preview923±6268
1210 – 14Claude Sonnet 4.6 anthropic/claude-sonnet-4.6843±5758
1310 – 14Kimi K2.5 moonshotai/kimi-k2.5834±8171
1412 – 14Claude Opus 4.6 anthropic/claude-opus-4.6730±7164
1515 – 15Nemotron 3 Super 120b A12b nvidia/nemotron-3-super-120b-a12b568±9173

Chú Ý


Read Original (EN) Quay lại Newsletter