Skip to content
tinAI
Go back

Claude Opus 4.6 - Nâng Cấp Mô Hình Thông Minh Nhất

Bài gốc: Claude Opus 4.6

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Claude Opus 4.6 cải thiện kỹ năng lập trình, có khả năng xử lý dài hơn và vượt trội trên nhiều đánh giá so với các mô hình tiền nhiệm. Các nhà phát triển có thể tận dụng khả năng mới này cho các tác vụ hàng ngày và trong các nền tảng phổ biến.

Giới thiệu về Claude Opus 4.6

Chúng tôi đang nâng cấp mô hình thông minh nhất của mình.

Claude Opus 4.6 cải thiện kỹ năng lập trình, lên kế hoạch cẩn thận hơn, và duy trì các tác vụ agentic lâu hơn. Đặc biệt, mô hình này giờ có khả năng xử lý 1 triệu token trong cửa sổ bối cảnh thử nghiệm.

Khả năng Mới của Claude Opus 4.6

Opus 4.6 áp dụng khả năng mới trong nhiều nhiệm vụ công việc hàng ngày: phân tích tài chính, nghiên cứu, tạo tài liệu, bảng tính và thuyết trình. Trong Cowork, nơi Claude có thể đa nhiệm tự động, mô hình này thể hiện toàn bộ khả năng của mình.

Đánh giá và Hiệu suất

Opus 4.6 đạt nhiều thành tựu trong các đánh giá tiên tiến. Ví dụ, mô hình đạt điểm cao nhất trên đánh giá coding agentic Terminal-Bench 2.0 và vượt qua các mô hình khác trong Humanity’s Last Exam.

Trong GDPval-AA, Opus 4.6 vượt GPT-5.2 khoảng 144 điểm Elo và phiên bản cũ - Claude Opus 4.5 - khoảng 190 điểm. Nó cũng thể hiện tốt hơn trên BrowseComp, đo lường khả năng tìm kiếm thông tin khó tìm trực tuyến.

An Toàn và Điều Chỉnh

Opus 4.6 vẫn giữ profil an toàn tổng thể tốt nhất trong ngành. Các cập nhật bao gồm adaptive thinkingcontext compaction. Mô hình cũng áp dụng phương pháp bảo vệ mới trong các khả năng mạnh mẽ có thể bị lợi dụng.

Cập Nhật Sản Phẩm và API

Trên API, khả năng điều chỉnh effort và tính năng 1M token context window (beta) đã được bổ sung. Nâng cấp Claude in Excel và phát hành Claude in PowerPoint cũng đã sẵn sàng.

Đánh Giá của Người Dùng

Ngoài việc cải thiện khả năng lập trình, Opus 4.6 cũng nâng cao khả năng nhận thức và xử lý các vấn đề phức tạp mà các mô hình trước đó chưa từng làm được. Được đánh giá cao về khả năng tư duy độc lập và hiệu suất vượt trội, nó trở thành công cụ đồng hành mạnh mẽ cho developer.


Read Original (EN) Quay lại Newsletter