Сразу после тестирования Index TTS2 потолок открытого клонирования голоса снова был поднят.



Самое большое отличие от других TTS — это «эмоциональный контроль». Вместо механического чтения можно указать, что он говорит в «грустном, зломственном, чрезвычайно взволнованном» тоне, а также контролирует темп и паузы. Механизм Zero-Shot, вставляю 10 секунд аудио и клонируй его напрямую.

Но оригинальное развертывание на Github крайне античеловеческое. Версия Card CUDA, зависимости Card Python, среда компиляции на C++. Обычные компьютеры работают с нативным кодом, и ошибки можно сообщать в течение дня.

Для собственного использования моей команды я инкапсулировал зависимости среды. Он стал интеграционным пакетом в один клик для обеих версий Windows и Mac.

· Декомпрессия (обратите внимание, что путь не на китайском)
· Двойной клик, чтобы запустить .bat одним кликом
· Веб-сторона управляется напрямую через WebUI
Работает офлайн локально, не тратя ни копейки на Token. Если нужно, можете отправить личное сообщение!
Адрес проекта с открытым исходным кодом:
Посмотреть Оригинал
post-image
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить