2026-01-02 13:06:49

Щойно протестував Index TTS2, і межа відкритого коду для голосового клонування знову піднята.

Найбільша відмінність від інших TTS — «емоційне керування». Це не механічне читання, ви можете вказати йому говорити з «сумом, гнівом, надзвичайним збудженням», а також контролювати швидкість мови та паузи. Механізм Zero-Shot, вставляєте 10-секундний аудіо і одразу отримуєте клон.

Але оригінальна версія на Github дуже складна для запуску. Вимагає сумісності з CUDA, залежностей Python, налаштувань C++ компілятора. Звичайний комп’ютер із нативним кодом може видавати помилки цілий день.

Щоб полегшити використання команді, я повністю об’єднав усі залежності у один пакет. Створив дві версії для Windows і Mac — однопоточний інсталяційний пакет.

· Розпакуйте (уважно, щоб шлях не містив китайських символів)
· Двічі клацніть на файл 一鍵啟動.bat
· Веб-інтерфейс доступний через WebUI
Локальна офлайн-робота без витрат на токени. За потреби — пишіть у приватні повідомлення!
Адреса відкритого проекту:

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.