Skip to content
tinAI
Go back

Voxtral phiên âm nhanh như tốc độ âm thanh

Bài gốc: Voxtral transcribes at the speed of sound.

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Voxtral Transcribe 2 giới thiệu hai mô hình phiên âm tiên tiến với khả năng xử lý tự động và độ trễ thấp. Voxtral Realtime tối ưu cho phiên âm trực tiếp với độ trễ dưới 200ms, còn Voxtral Mini Transcribe V2 cho phiên âm hàng loạt với chi phí thấp nhất.

Voxtral phát hành Transcribe 2

Hôm nay, chúng tôi chính thức ra mắt Voxtral Transcribe 2, hai mô hình phiên âm giọng nói thế hệ mới với chất lượng hàng đầu, tự động hóa và độ trễ cực thấp. Dòng sản phẩm bao gồm Voxtral Mini Transcribe V2 cho phiên âm hàng loạt và Voxtral Realtime cho ứng dụng trực tiếp. Voxtral Realtime cung cấp mã nguồn mở dưới giấy phép Apache 2.0.

Chúng tôi cũng ra mắt phòng thử nghiệm âm thanh trong Mistral Studio để kiểm tra ngay lập tức, với khả năng tự động phân biệt người nói và dán nhãn thời gian.

Điểm nổi bật

Voxtral Realtime

Voxtral Realtime được thiết kế cho các ứng dụng mà độ trễ là quan trọng. Không giống như những phương pháp xử lý âm thanh theo khối ngoại tuyến, Realtime sử dụng kiến trúc streaming mới để phiên âm âm thanh khi vừa nhận được. Mô hình này có thể điều chỉnh độ trễ xuống dưới 200ms, mở ra một lớp ứng dụng giọng nói mới.

Mô hình này hỗ trợ đa ngôn ngữ mạnh mẽ với 13 ngôn ngữ và trọng số mô hình được phát hành trên Hugging Face Hub.

Voxtral Mini Transcribe V2

Voxtral Mini Transcribe V2 mang lại cải tiến đáng kể trong chất lượng phiên âm và tự động phân biệt người nói trong nhiều ngôn ngữ và lĩnh vực.

Tính năng sẵn sàng cho doanh nghiệp

Phòng thử nghiệm âm thanh

Thử ngay Voxtral Transcribe 2 trong Mistral Studio. Hỗ trợ tải lên đến 10 tập tin âm thanh.

Ứng dụng giọng nói tiên tiến

Cả hai mô hình hỗ trợ triển khai phù hợp với GDPR và HIPAA qua các phương thức on-premise hoặc đám mây riêng.

Bắt đầu

Voxtral Mini Transcribe V2 hiện có sẵn qua API với giá $0,003 mỗi phút. Thử ngay trong phòng thử nghiệm Mistral Studio.

Voxtral Realtime cũng có sẵn qua API và dưới dạng mã nguồn mở trên Hugging Face.

Khám phá tài liệu về khả năng âm thanh và phiên âm của Mistral.


Read Original (EN) Quay lại Newsletter