Skip to content
tinAI
Go back

Ra mắt HN: Cekura (YC F24) – Kiểm thử và giám sát AI giọng nói và chat

Bài gốc: Launch HN: Cekura (YC F24) – Testing and monitoring for voice and chat AI agents

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Cekura giúp kiểm thử và giám sát các tác nhân AI thông qua mô phỏng người dùng thực, xác định lỗi trước khi vào sản xuất. Công cụ tạo tình huống, mô phỏng công cụ giả lập và các test case có cấu trúc giúp đảm bảo tính chính xác của AI.

Giới thiệu Cekura

Chúng tôi là Tarush, Sidhant, và Shashij từ Cekura (https://www.cekura.ai). Chúng tôi đã hoạt động trong lĩnh vực mô phỏng tác nhân giọng nói 1,5 năm và mở rộng sang chat gần đây. Cekura được sử dụng để mô phỏng hội thoại người dùng thực, kiểm tra độ ổn định của prompt và hành vi của LLM.

Vấn đề chính

Bạn không thể QA tác nhân AI thủ công. Khi xuất bản prompt mới, thay đổi mẫu, hoặc thêm công cụ, làm sao biết nó vẫn hoạt động đúng ở hàng ngàn cách người dùng tương tác? Hầu hết đội ngũ làm việc thủ công hoặc chờ người dùng phản hồi - không hiệu quả và quá muộn. Phương pháp của chúng tôi là mô phỏng: người dùng tổng hợp tương tác với tác nhân như người dùng thật và đánh giá của LLM để kiểm tra tính chính xác của phản hồi.

Các yếu tố làm cho Cekura hiệu quả

Giám sát lưu lượng tác nhân trực tiếp

Cekura theo dõi toàn bộ phiên hội thoại chứ không phải từng turn riêng lẻ, giúp phát hiện lỗi xuất hiện khi các turn có quan hệ với nhau.

Thử nghiệm Cekura

Dùng thử miễn phí trong 7 ngày, không cần thẻ tín dụng. Các gói trả phí bắt đầu từ $30/tháng. Xem video sản phẩm tại Cekura Video.

Phản hồi từ cộng đồng HN

Chúng tôi rất muốn biết cách bạn đang kiểm thử hồi quy hành vi trong tác nhân của mình và các lỗi nào gây khó khăn nhất cho bạn.


Read Original (EN) Quay lại Newsletter