达芬奇DaVinci Resolve生成AI驱动的字幕脚本
一、autosubs-为 DaVinci Resolve 生成 AI 驱动的字幕
官网:https://tom-moroney.com/auto-subs/#how-it-works
GitHub:https://github.com/tmoroney/auto-subs
使用 OpenAI Whisper
和 Stable-TS
自动转录您的编辑时间线,以实现极高的准确性。
- 以您自己的自定义样式生成字幕。
- 完全免费,并在 Davinci Resolve 中本地运行。
- 适用于 Mac、Linux 和 Windows。
- 在 Free 和 Studio 版本的 Resolve 上均受支持。
- 使用 Subtitle Navigator 跳转到时间轴上的位置。
- 新增功能!!- 从任何语言翻译成英语。
主要特点
AI 驱动的速度
在几分钟内生成精确的字幕,从而在视频制作工作流程中节省宝贵的时间。
定制
使用可自定义的颜色、动画和样式效果设计独特的字幕。
多种语言
支持 50+ 种语言的转录,并可选择将字幕翻译成英文。
如何运作
选择模型
从各种 AI 转录模型中进行选择,平衡速度和准确性。
AI 处理
在短短几分钟内生成准确的字幕并将其添加到编辑时间线中。
编辑和导出
轻松进行编辑并导出带有专业品质字幕的视频。
使用指南
详细教程请查阅git仓库
第 1 步:打开 Auto-Subs
单击 Resolve 顶部菜单栏中的 ,然后从列表中选择。Workspace``Scripts``auto-subs
Workspace -> Scripts -> auto-subs
第 2 步:创建您的模板
将 添加到 时间轴,根据您的喜好对其进行自定义,然后将其拖动到 .这将用作字幕的模板。Text+``Media Pool
第 3 步:选择一个区域以添加字幕
使用键盘上的 和 键标记要字幕的区域的开头(“In”)和结尾(“Out”)。I``O
第 4 步:转录
单击 **“Generate Subtitles”(生成字幕)
**以转录所选的时间轴区域。
手动设置
总结:
- 安装
Python 3.8 - 3.12
- 安装
OpenAI Whisper
- 安装
FFMPEG
(由 Whisper 用于音频处理) - 安装
Stable-TS
(改善字幕) - 下载 + 复制
auto-subs.py
到 Fusion Scripts 文件夹。
手动(Windows、Mac、Linux)
下载 auto-subs.py
文件并将其添加到以下目录之一:
- 窗户:
- 所有用户:
%PROGRAMDATA%\Blackmagic Design\DaVinci Resolve\Fusion\Scripts
- 特定用户:
%APPDATA%\Blackmagic Design\DaVinci Resolve\Support\Fusion\Scripts
- 所有用户:
- Mac 操作系统:
- 所有用户:
/Library/Application Support/Blackmagic Design/DaVinci Resolve/Fusion/Scripts/Utility
- 特定用户:
/Users/<UserName>/Library/Application Support/Blackmagic Design/DaVinci Resolve/Fusion/Scripts/Utility
- 所有用户:
- Linux的:
- 所有用户:(或取决于安装)
/opt/resolve/Fusion/Scripts/Utility``/home/resolve/Fusion/Scripts/Utility
- 特定用户:
$HOME/.local/share/DaVinciResolve/Fusion/Scripts/Utility
- 所有用户:(或取决于安装)
轻量级
注意
此版本已删除音频转录。这意味着设置较少,但需要字幕 (SRT) 文件作为输入。如果您已经有转录视频的方法(例如 Davinci Resolve Studio 的内置字幕功能或 CapCut 字幕),并且您只想要具有自定义主题的字幕,请使用此选项。
从 SRT 文件创建主题字幕。
第 1 步
安装任何版本的 Python(安装过程中打勾)"Add python.exe to PATH"
步骤 2
下载 并将其放在 Fusion Scripts 文件夹的文件夹中。Utility
...\Blackmagic Design\DaVinci Resolve\Fusion\Scripts\Utility
手动设置
总结:
- 安装
Python 3.8 - 3.12
- 安装
OpenAI Whisper
- 安装
FFMPEG
(由 Whisper 用于音频处理) - 安装
Stable-TS
(改善字幕) - 下载 + 复制
auto-subs.py
到 Fusion Scripts 文件夹。
二、浩叔的智能字幕生成工具
Github:https://github.com/minghe36/vinci-subtitle-man?tab=readme-ov-file
功能特点
- 本地运行,免费的
- 效率高,全程点一点,自动完成,无需在多个软件切换
- 支持使用 dify 进行字幕优化,可以自定义纠错规则,支持基于文稿修正字幕
- 支持直接编辑和更新字幕内容
安装说明
在 github 中下载插件代码
将插件文件夹复制到达芬奇插件目录下,目录路径:
- mac:/Library/Application Support/Blackmagic Design/DaVinci Resolve/Fusion/Scripts
- win:C:\Users[用户名]\AppData\Roaming\Blackmagic Design\DaVinci Resolve\Support\Fusion\Scripts
安装 stable-ts 库
本插件依赖 stable-ts 库,请确保安装成功,否则无法使用。 stable-ts 是对 open ai 的 whisper 库的优化封装,依赖于 whisper.
安装方法:
安装 FFmpeg 依赖库
# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg
# on Arch Linux
sudo pacman -S ffmpeg
# on MacOS using Homebrew (https://brew.sh/)
brew install ffmpeg
# on Windows using Chocolatey (https://chocolatey.org/)
choco install ffmpeg
# on Windows using Scoop (https://scoop.sh/)
scoop install ffmpeg
安装 PyTorch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
安装 stable-ts
pip install -U git+https://github.com/jianfch/stable-ts.git
- 配置 dify API key
你可以自己在 dify 中配置纠错优化的大模型逻辑,dify 的使用请看我的系列教程:浩叔的dify+cursor课程
如果你嫌麻烦,可以先临时使用我的 API key:app-zZ6K9xI0jC4e3zHa6XiKKcjZ,我用的是暂时免费的Grok模型,优化效果很不错,关键支持长文优化。
(该 API key 不保证长期有效)
使用步骤
第一步:生成字幕初稿
- 选择合适的转录模型:
- base:基础模型,速度最快,准确度一般
- small:小型模型,推荐使用,速度和准确度均衡
- medium:中型模型,准确度较高,速度较慢
- large:大型模型,准确度最高,速度最慢 推荐使用 small 来生成,medium、large 虽然效果更好,但转录速度很慢,通过 small 生成初稿,再通过 dify 使用大模型二次优化字幕效果更好
- 选择视频语言:
- 支持中文、英语、日语、韩语、德语、法语
- 选择正确的语言可以提高识别准确度
- 点击”生成字幕初稿”按钮:
- 插件会自动渲染时间线在插件 temp 目录下生成.wav 音频文件
- 使用 stable-ts 进行语音识别
- 生成 SRT 格式字幕文件
第二步:优化字幕(可选)
- 填写必要信息:
- dify key(必填):填写您的 dify API 密钥
- 文稿链接(选填):可以提供参考文稿链接
- 字幕优化规则(选填):可以设置特定的优化规则
- 点击”使用dify优化字幕”按钮:
- 调用 dify API 进行字幕优化
- 支持根据文稿和规则进行调整
- 优化结果会自动更新到字幕框中
基于文稿优化,确保文稿链接是公开可访问的。
第三步:插入字幕
- 编辑字幕内容(如需要):
- 在右侧字幕框中直接编辑
- 点击”更新字幕”保存修改
- 点击”将字幕插入到时间线”按钮:
- 自动将字幕导入到媒体池
- 自动添加到当前时间线
- 完成字幕插入