菜单导航

基于GPT-SoVITS的视频剪辑快捷配音工具
AIGC

基于GPT-SoVITS的视频剪辑快捷配音工具

NoiseNoise
2024-03-31

该项目是一个拥有 GUI 悬浮窗界面的 GPT-SoVITS 推理程序,可以通过模拟操作系统的文件拖拽信号,将合成的语音直接拖拽至视频剪辑软件(如 Adobe Premiere)的时间轴,更加方便地实现视频的配音。

项目地址:https://github.com/2DIPW/dub_genius

推理核心源码基于 RVC-Boss/GPT-SoVITS 修改,GUI 界面基于 PySide6 实现,exe可执行文件由 PyStand 编译。

💻 截图

📥 部署

可以直接下载带有 exe 可执行文件的整合包,也可以自行部署依赖环境并从命令行运行。

整合包

整合包自带全部依赖和预训练模型,以及一个 Python 3.9.13 的嵌入式版本,可通过 exe 可执行文件独立运行。

PyTorch版本 大小 下载地址
CPU推理版本 2.2.1 989 MB OneDrive(https://1drv.ms/u/s!ApF_M_PJgMjabK4tbMUTw5nFt-g?e=C3O0JN) | 百度网盘(https://pan.baidu.com/s/1sKlushysdxq1ce-IBHcJaw?pwd=nqwm)
GPU推理版本 2.2.1+cu118 2.18 GB OneDrive(https://1drv.ms/u/s!ApF_M_PJgMjabWCA4_s3fwxwi7M?e=nObvOo) | 百度网盘(https://pan.baidu.com/s/1pR1gNF1TmIl_5kASQzEnJQ?pwd=nbqa)

自行部署

克隆

git clone https://github.com/2DIPW/dub_genius.git
cd dub_genius

安装依赖

如果有现成的为 RVC-Boss/GPT-SoVITS 配置的环境,为了节省空间,可以在其基础上安装 PySide6。

pip install pyside6

否则,请安装全部依赖

pip install -r requirements.txt

配置 GPU 加速(可选)

安装 CUDA 版本的 PyTorch

pip install torch --index-url https://download.pytorch.org/whl/cu118

配置预训练模型

本项目需要 RVC-Boss/GPT-SoVITS(https://github.com/RVC-Boss/GPT-SoVITS) 中的GPT_SoVITS/pretrained_models 目录下的 chinese-hubert-basechinese-roberta-wwm-ext-large两个预训练模型,置于pretrained目录下。

运行

python dub_genius.py

🗝 使用方法

  1. 添加模型组: 首次使用自动进入模型组管理对话框,单击添加,进入编辑模型组对话框
    • 填写模型组名,并选择 GPT 和 SoVITS 模型文件。
    • 单击添加以添加参考音频,别名参考文本默认值取自文件名,可以通过双击进入编辑状态来修改。单击文件路径可以重新指定该项的文件路径。语言默认为中文,如需批量修改语言,选中它们所在的行,并通过批量修改语言为来修改。
  2. 指定保存路径: 单击保存路径文本框旁的...,设置满意的合成结果将会保存到何处,通常设置为视频剪辑项目所在的位置。
  3. 输入文本并合成语音: 单击合成,合成完毕后会自动播放试听,若满意该条合成结果,单击保存即可将其保存至设置的路径,同时会将该条目添加至合成结果列表。
  4. 拖拽至时间轴: 从合成结果列表中将所需的语音拖拽至视频剪辑软件时间轴,即可完成配音的添加。如还需添加字幕,双击合成结果列表的条目即可将该项所对应的文本复制到剪贴板中。
版权声明

本文为「Noise」原创内容或编译整理;除特别说明外,文中图片并非个人手绘,可能来源于网络、AI 生成、截图等,后期使用 PhotoMator / Procreate 进行处理,仅用于学习与交流。如涉及版权或来源标注不全,请联系处理。未经授权,禁止用于商业用途,禁止抹除水印。转载请注明出处与链接并保留本声明。

...

评论 (0)

评论功能加载中...
Noise

Noise

执迷不悟

推荐阅读

Belin Doc-一键完成高质量文档翻译
AIGC

Belin Doc-一键完成高质量文档翻译

Noise | 2025-08-10

Belin Doc 是一款由 AI 驱动的免费、无限制 文档翻译工具。无需注册,没有限制。

截止发文,该产品属于新产品,未看到上架定价,未登录时可每日使用1000次,但任务有排队

官网:https://belindoc.com

功能

	文档翻译:支持多种格式的文档翻译,
544
eechat-跨平台本地部署LLM工具,支持mcp接入
AIGC

eechat-跨平台本地部署LLM工具,支持mcp接入

Noise | 2025-07-25

eechat 是一款开源免费的国产 AI 应用,支持 Windows、macOS 和 Linux,集成了聊天、多模态指令执行(MCP)、知识库问答(RAG)、语音识别(ASR)、语音合成(TTS)等功能模块。

	开箱即用,无需代码基础,适合非技术背景用户。
	免费开源,国产的免费
895
🔥AI时代神器!Revornix让你的资讯管理效率翻倍!🚀
AIGC

🔥AI时代神器!Revornix让你的资讯管理效率翻倍!🚀

Noise | 2025-07-16

这是一个集合了文档知识库、智能解析、AI助手、mcp、用户专栏等功能的现代化工具

官网:https://revornix.com/zh

目前该工具还处于不断完善中,你可以访问官网来查看最新开发状态及加入官方社群,下方来源于官方介绍
功能特性

	跨平台可用:当
453