Щойно протестував Index TTS2, і межа відкритого коду для голосового клонування знову піднята.



Найбільша відмінність від інших TTS — «емоційне керування». Це не механічне читання, ви можете вказати йому говорити з «сумом, гнівом, надзвичайним збудженням», а також контролювати швидкість мови та паузи. Механізм Zero-Shot, вставляєте 10-секундний аудіо і одразу отримуєте клон.

Але оригінальна версія на Github дуже складна для запуску. Вимагає сумісності з CUDA, залежностей Python, налаштувань C++ компілятора. Звичайний комп’ютер із нативним кодом може видавати помилки цілий день.

Щоб полегшити використання команді, я повністю об’єднав усі залежності у один пакет. Створив дві версії для Windows і Mac — однопоточний інсталяційний пакет.

· Розпакуйте (уважно, щоб шлях не містив китайських символів)
· Двічі клацніть на файл 一鍵啟動.bat
· Веб-інтерфейс доступний через WebUI
Локальна офлайн-робота без витрат на токени. За потреби — пишіть у приватні повідомлення!
Адреса відкритого проекту:
Переглянути оригінал
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити