Giới thiệu về Claude Opus 4.6
Chúng tôi đang nâng cấp mô hình thông minh nhất của mình.
Claude Opus 4.6 cải thiện kỹ năng lập trình, lên kế hoạch cẩn thận hơn, và duy trì các tác vụ agentic lâu hơn. Đặc biệt, mô hình này giờ có khả năng xử lý 1 triệu token trong cửa sổ bối cảnh thử nghiệm.
Khả năng Mới của Claude Opus 4.6
Opus 4.6 áp dụng khả năng mới trong nhiều nhiệm vụ công việc hàng ngày: phân tích tài chính, nghiên cứu, tạo tài liệu, bảng tính và thuyết trình. Trong Cowork, nơi Claude có thể đa nhiệm tự động, mô hình này thể hiện toàn bộ khả năng của mình.
Đánh giá và Hiệu suất
Opus 4.6 đạt nhiều thành tựu trong các đánh giá tiên tiến. Ví dụ, mô hình đạt điểm cao nhất trên đánh giá coding agentic Terminal-Bench 2.0 và vượt qua các mô hình khác trong Humanity’s Last Exam.
Trong GDPval-AA, Opus 4.6 vượt GPT-5.2 khoảng 144 điểm Elo và phiên bản cũ - Claude Opus 4.5 - khoảng 190 điểm. Nó cũng thể hiện tốt hơn trên BrowseComp, đo lường khả năng tìm kiếm thông tin khó tìm trực tuyến.
An Toàn và Điều Chỉnh
Opus 4.6 vẫn giữ profil an toàn tổng thể tốt nhất trong ngành. Các cập nhật bao gồm adaptive thinking và context compaction. Mô hình cũng áp dụng phương pháp bảo vệ mới trong các khả năng mạnh mẽ có thể bị lợi dụng.
Cập Nhật Sản Phẩm và API
Trên API, khả năng điều chỉnh effort và tính năng 1M token context window (beta) đã được bổ sung. Nâng cấp Claude in Excel và phát hành Claude in PowerPoint cũng đã sẵn sàng.
Đánh Giá của Người Dùng
Ngoài việc cải thiện khả năng lập trình, Opus 4.6 cũng nâng cao khả năng nhận thức và xử lý các vấn đề phức tạp mà các mô hình trước đó chưa từng làm được. Được đánh giá cao về khả năng tư duy độc lập và hiệu suất vượt trội, nó trở thành công cụ đồng hành mạnh mẽ cho developer.