Skip to content
tinAI
Go back

GitHub - KittenML/KittenTTS: Mô hình TTS tiên tiến dưới 25MB 😻

Bài gốc: GitHub - KittenML/KittenTTS: State-of-the-art TTS model under 25MB 😻

Tác giả: Unknown

Ngày đăng: Dịch ngày:

TL;DR

Kitten TTS là thư viện chuyển văn bản thành giọng nói nhẹ, mã nguồn mở với các mô hình từ 15M đến 80M tham số, vận hành hiệu quả trên CPU mà không cần GPU. Có sẵn hỗ trợ thương mại cho tích hợp và phát triển giọng nói.

Kitten TTS

Kitten TTS là thư viện chuyển văn bản thành giọng nói (TTS) mở rộng,trọng lượng nhẹ, phát triển trên nền tảng ONNX. Với các mô hình có kích thước từ 15M đến 80M tham số (25-80 MB trên đĩa), nó cung cấp khả năng tổng hợp giọng nói chất lượng cao trên CPU mà không cần dùng đến GPU.

Tính năng

Mô Hình Sẵn Có

Mô HìnhTham SốKích ThướcTải Về
kitten-tts-mini80M80 MBKittenML/kitten-tts-mini-0.8
kitten-tts-micro40M41 MBKittenML/kitten-tts-micro-0.8
kitten-tts-nano15M56 MBKittenML/kitten-tts-nano-0.8-fp32
kitten-tts-nano (int8)15M25 MBKittenML/kitten-tts-nano-0.8-int8

Lưu ý: Một số người dùng đã báo cáo vấn đề với mô hình kitten-tts-nano-0.8-int8. Nếu bạn gặp vấn đề, hãy mở một issue.

Hướng Dẫn Nhanh

Yêu Cầu

Cài đặt

pip install https://github.com/KittenML/KittenTTS/releases/download/0.8.1/kittentts-0.8.1-py3-none-any.whl

Sử Dụng Cơ Bản

from kittentts import KittenTTS

model = KittenTTS("KittenML/kitten-tts-mini-0.8")
audio = model.generate("This high-quality TTS model runs without a GPU.", voice="Jasper")

import soundfile as sf
sf.write("output.wav", audio, 24000)

Sử Dụng Nâng Cao

# Điều chỉnh tốc độ phát (mặc định: 1.0)
audio = model.generate("Hello, world.", voice="Luna", speed=1.2)

# Lưu trực tiếp vào file
model.generate_to_file("Hello, world.", "output.wav", voice="Bruno", speed=0.9)

# Danh sách giọng nói có sẵn
print(model.available_voices)
# ['Bella', 'Jasper', 'Luna', 'Bruno', 'Rosie', 'Hugo', 'Kiki', 'Leo']

Yêu Cầu Hệ Thống

Hỗ Trợ Thương Mại

Chúng tôi cung cấp hỗ trợ thương mại cho các đội nhóm tích hợp Kitten TTS vào sản phẩm của họ. Điều này bao gồm hỗ trợ tích hợp, phát triển giọng nói tùy chỉnh, và cấp phép doanh nghiệp. Liên hệ chúng tôi hoặc email info@stellonlabs.com.

Cộng Đồng và Hỗ Trợ

Giấy Phép

Dự án này được cấp quyền sử dụng theo Apache License 2.0.


Read Original (EN) Quay lại Newsletter