ChatTTS-Forge-WebUI 加强版ChatTTS
ChatTTS-Forge 是一个围绕 TTS 生成模型开发的项目,实现了 API 服务器和基于 Gradio 的 WebUI
Github:https://github.com/lenML/ChatTTS-Forge?tab=readme-ov-file
离线安装包
夸克:https://pan.quark.cn/s/b87a64e0f2eb
百度:https://pan.baidu.com/s/1Q1vQV5Gs0VhU5J76dZBK4Q?pwd=d7xu
特征
-
-
ChatTTS 模型原生功能 Refiner/Generate
-
原生 Batch 合成,高效合成超长文本
-
样式控制
-
SSML公司
-
编辑器: 简单的 SSML 编辑,配合其他功能使用
-
Spliter:超长文本分割预处理
-
Podcast: 支持创建编辑播客脚本
-
-
议长
-
内置音色:内置众多 speaker 可以使用
-
speaker creator: 支持试音抽卡,创建 speaker
-
embdding: 支持 speaker embdding 上传,可以复用保存下来的 speaker
-
speaker merge: 支持合并说话人,微调 speaker
-
-
提示插槽
-
文本规范化
-
音质增强:
-
enhance: 音质增强提高输出质量
-
denoise: 去除噪音
-
-
Experimental 实验功能
-
Fintune
-
扬声器嵌入
-
[在制品]GPT劳拉
-
[在制品]自动曝光
-
安装与运行
-
确保 已经正确安装,
-
根据你的需求启动需要的服务。
-
WebUI的:
python webui.py
-
应用程序接口:
python launch.py
GPU 显存要求
2.1. 模型加载显存需求
精度 ChatTTS 模型 Enhancer 模型 全精度 2GB内存 3GB内存 半精度 1GB接口 1.5千兆字节(GB) 注:半精度为默认设置,全精度可通过 参数启用。
--no_half
2.2. 推理过程显存需求
精度 批量大小 不使用 Enhancer 使用 Enhancer 全精度 ≤ 4 2GB内存 4GB接口 全精度 8 4-10GB 6-14GB 半精度 ≤ 4 1GB接口 2GB内存 半精度 8 2-6GB 4-8GB 注意事项:
-
显存需求与上下文长度相关,因此呈现为一个范围。
-
半精度(默认)的显存需求约为全精度的一半。
-
对于 Batch Size ≤ 4,4GB 显存通常足够进行推理。
-
-
-