刚测完 Index TTS2,开源语音克隆的天花板又被顶高了。



跟其他 TTS 最大的区别是“情感控制”。 不是机械的朗读,你可以指定它用“悲伤、愤怒、极度兴奋”的语气说话,甚至能控制语速和停顿。Zero-Shot 机制,丢进去 10 秒音频直接克隆。

但 Github 原版部署极其反人类。 卡 CUDA 版本、卡 Python 依赖、卡 C++ 编译环境。普通电脑跑原生代码,报错能报一天。

为了给团队自用,我把环境依赖全封装了。 做成了 Windows / Mac 双版本的一键整合包 。

· 解压(注意路径别带中文)
· 双击 一键启动.bat
· 网页端直接通过 WebUI 操作
本地离线运行,不花一分钱 Token。需要可以私信!
项目开源地址:
post-image
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)