菜单导航

资源分享
开源视频翻译和配音工具
资源分享

开源视频翻译和配音工具

NoiseNoise
2024-01-05

介绍

这是一个离线运行的本地语音识别转文字工具,基于 fast-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出json格式、srt字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同openai官方api接口

Github:https://github.com/jianchang512/stt

官方文档:https://v.wonyes.org

特征

语音自动生成字幕

生成字幕后,可在软件中对字幕进行修改后再生成配音

多种配音角色可选择

可选edgeTTS多种配音角色,并支持openai的TTS模型配音

支持多种翻译引擎

google+chatGPT+DeepL+Baidu+DeepLX+Gemini+tencent

1704464210469

主要用途和使用方式

【翻译视频并配音】根据需要设置各个选项,自由配置组合,实现翻译和配音、自动加减速、合并等

【提取字幕不翻译】选择视频文件,选择视频源语言,则从视频识别出文字并自动导出字幕文件到目标文件夹

【提取字幕并翻译】选择视频文件,选择视频源语言,设置想翻译到的目标语言,则从视频识别出文字并翻译为目标语言,然后导出双语字幕文件到目标文件夹

【字幕和视频合并】选择视频,然后将已有的字幕文件拖拽到右侧字幕区,将源语言和目标语言都设为字幕所用语言、然后选择配音类型和角色,开始执行

【为字幕创建配音】将本地的字幕文件拖拽到右侧字幕编辑器,然后选择目标语言、配音类型和角色,将生成配音后的音频文件到目标文件夹

【音视频识别文字】将视频或音频拖拽到识别窗口,将识别出文字并导出为srt字幕格式

【将文字合成语音】将一段文字或者字幕,使用指定的配音角色生成配音

【从视频分离音频】将视频文件分离为音频文件和无声视频

【音视频字幕合并】音频文件、视频文件、字幕文件合并为一个视频文件

【音视频格式转换】各种格式之间的相互转换 【文字字幕翻译】将文字或srt字幕文件翻译为其他语言

全部模型下载地址:https://github.com/jianchang512/stt/releases/tag/0.0

源码部署

  1. 配置好 python 3.9->3.11 环境
  2. git clone https://github.com/jianchang512/pyvideotrans
  3. cd pyvideotrans
  4. python -m venv venv
  5. win下执行 %cd%/venv/scripts/activate,linux和mac执行 source ./venv/bin/activate
  6. pip install -r requirements.txt,如果遇到版本冲突报错,请使用 pip install -r requirements.txt --no-deps
  7. win下解压 ffmpeg.zip 到根目录下 (ffmpeg.exe文件),linux和mac 到 ffmpeg官网下载对应版本ffmpeg,解压到根目录下,注意必须是直接将可执行文件 ffmpeg 放在根目录下
  8. python sp.py 打开软件界面
  9. 如果需要支持CUDA加速,需要设备具有 NVIDIA 显卡,具体安装防范见下方 CUDA加速支持

预览

img

imgimgimgimg

版权声明

本文为「Noise」原创内容或编译整理;除特别说明外,文中图片并非个人手绘,可能来源于网络、AI 生成、截图等,后期使用 PhotoMator / Procreate 进行处理,仅用于学习与交流。如涉及版权或来源标注不全,请联系处理。未经授权,禁止用于商业用途,禁止抹除水印。转载请注明出处与链接并保留本声明。

...

评论 (0)

评论功能加载中...
Noise

Noise

执迷不悟

推荐阅读

跨平台云盘挂载本地客户端-OpenList Desktop
资源分享

跨平台云盘挂载本地客户端-OpenList Desktop

Noise | 2025-07-19

OpenList Desktop是一个为 OpenList (Alist) 和 Rclone 设计的跨平台桌面客户端。它提供了一个现代化且用户友好的图形界面,帮助您轻松管理 Alist 服务和 Rclone 云盘挂载,无需记忆和输入繁琐的命令行指令。

开源地址:https://gith

1374
小红书AI辅助创作插件-RedConvert
资源分享

小红书AI辅助创作插件-RedConvert

Noise | 2025-07-19

这是一个 Chrome 扩展,支持在小红书笔记页面一键下载当前笔记的标题、正文和所有图片,并打包成 ZIP 文件保存到本地,还支持 AI 智能仿写、OCR 图片内容提

66
开源软件精选-跨平台轻量小宇宙播客桌面版
资源分享

开源软件精选-跨平台轻量小宇宙播客桌面版

Noise | 2025-07-18

horizon使用 wails + react 构建的第三方小宇宙桌面客户

256