Vừa mới thử nghiệm Index TTS2, giới hạn của công nghệ sao chép giọng nói mã nguồn mở lại được nâng cao.
Điểm khác biệt lớn nhất so với các TTS khác là “Kiểm soát cảm xúc”. Không phải đọc máy móc, bạn có thể chỉ định nó nói với giọng “buồn bã, giận dữ, cực kỳ phấn khích”, thậm chí kiểm soát tốc độ và điểm dừng. Cơ chế Zero-Shot, bỏ vào 10 giây âm thanh để sao chép trực tiếp.
Nhưng triển khai bản gốc trên Github cực kỳ phi nhân tính. Đòi hỏi CUDA phiên bản, phụ thuộc Python, môi trường biên dịch C++. Máy tính bình thường chạy mã gốc, báo lỗi cả ngày.
Để phục vụ nhóm của tôi, tôi đã đóng gói toàn bộ các phụ thuộc môi trường. Tạo thành gói tích hợp một lần cho Windows / Mac.
· Giải nén (chú ý không để đường dẫn có tiếng Trung) · Nhấn đúp vào tệp 一键启动.bat · Truy cập trực tiếp qua WebUI trên trình duyệt Chạy offline tại chỗ, không tốn một đồng Token nào. Cần thì inbox riêng! Địa chỉ dự án mã nguồn mở:
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Vừa mới thử nghiệm Index TTS2, giới hạn của công nghệ sao chép giọng nói mã nguồn mở lại được nâng cao.
Điểm khác biệt lớn nhất so với các TTS khác là “Kiểm soát cảm xúc”. Không phải đọc máy móc, bạn có thể chỉ định nó nói với giọng “buồn bã, giận dữ, cực kỳ phấn khích”, thậm chí kiểm soát tốc độ và điểm dừng. Cơ chế Zero-Shot, bỏ vào 10 giây âm thanh để sao chép trực tiếp.
Nhưng triển khai bản gốc trên Github cực kỳ phi nhân tính. Đòi hỏi CUDA phiên bản, phụ thuộc Python, môi trường biên dịch C++. Máy tính bình thường chạy mã gốc, báo lỗi cả ngày.
Để phục vụ nhóm của tôi, tôi đã đóng gói toàn bộ các phụ thuộc môi trường. Tạo thành gói tích hợp một lần cho Windows / Mac.
· Giải nén (chú ý không để đường dẫn có tiếng Trung)
· Nhấn đúp vào tệp 一键启动.bat
· Truy cập trực tiếp qua WebUI trên trình duyệt
Chạy offline tại chỗ, không tốn một đồng Token nào. Cần thì inbox riêng!
Địa chỉ dự án mã nguồn mở: