Giới thiệu về GPT-5.4
Hôm nay, OpenAI phát hành GPT-5.4 trong ChatGPT (dưới dạng GPT-5.4 Thinking), API và Codex. Đây là mô hình tiên tiến và hiệu quả nhất dành cho công việc chuyên môn. GPT-5.4 Pro cũng được phát hành để tối đa hóa hiệu suất.
Tính năng nổi bật
- Khả năng làm việc chuyên môn: Cải thiện trong suy luận, viết mã và làm việc trên các quy trình tác vụ chuyên nghiệp.
- Nâng cao nghiên cứu web chuyên sâu và duy trì ngữ cảnh lâu hơn cho các truy vấn phức tạp.
- Sử dụng công cụ máy tính: Khả năng tương tác với môi trường máy tính và thực hiện quy trình công việc phức tạp.
- Hỗ trợ lên đến 1 triệu token ngữ cảnh, nâng cao hiệu quả và tốc độ xử lý.
Làm việc chuyên môn
GPT-5.4 nâng cao khả năng suy luận trên các nhiệm vụ thực tế, đạt 83.0% trên bài kiểm tra GDPval so với 70.9% của phiên bản trước.
- Cải thiện trên bảng tính, tài liệu và bản trình bày: Được ưu tiên chọn bởi các chuyên gia do thẩm mỹ mạnh hơn và sử dụng hình ảnh hiệu quả hơn.
Sử dụng máy tính và tầm nhìn
GPT-5.4 là mô hình đa năng đầu tiên có khả năng sử dụng tương tác máy tính giúp nhà phát triển xây dựng agent hoàn thành nhiệm vụ thực tế trên hệ thống phần mềm.
- OSWorld-Verified: GPT-5.4 đạt tỷ lệ thành công 75.0%, vượt xa performance người dùng.
- Cải thiện khả năng nhìn nhận trực quan và phân tích tài liệu.
Viết mã
Tích hợp sức mạnh viết mã của GPT-5.3-Codex, GPT-5.4 thúc đẩy các nhiệm vụ phức tạp về frontend với kết quả đẹp mắt và chức năng hơn.
- Chế độ /fast giúp tăng tốc độ bằng 1.5x so với tốc độ xử lý token thông thường.
Sử dụng công cụ
- Tìm kiếm công cụ: Giảm số lượng token yêu cầu cho các quy trình làm việc nhiều công cụ, làm cho yêu cầu nhanh hơn và rẻ hơn.
- Hoàn thiện việc gọi công cụ giúp quyết định khi nào và cách sử dụng công cụ hiệu quả hơn.
An toàn
GPT-5.4 đã cải tiến các biện pháp an toàn với lớp bảo vệ không gian mạng mở rộng và nghiên cứu mới về khả năng giám sát suy nghĩ.
Khả dụng và giá cả
GPT-5.4 đang dần được triển khai trên ChatGPT và Codex, với phiên bản Pro dành cho những tác vụ phức tạp.
- Giá API: Cao hơn GPT-5.2, nhưng hiệu quả token tốt hơn giúp giảm tổng số token cần thiết cho nhiều tác vụ.
Đánh giá
- Chuyên nghiệp: GPT-5.4 đạt tỷ lệ thành công cao hơn trên các nhiệm vụ chuyên môn.
- Viết mã: Hiệu suất vượt trội trên SWE-Bench Pro.
- Sử dụng máy tính và tầm nhìn: Thành công cao hơn trên các bài tiêu chuẩn kiểm tra hiệu suất sử dụng máy tính.