SubtitleOCR字幕工具 保姆级使用教程
═══════════════════════════════════════════════
一、前言
本工具全称 SubtitleOCR 字幕工具·整合版,由 慕静安 开发(网站:www.yzyy.org)。它是一款 绿色单文件 字幕处理工具,集成了两种工作模式,支持 百度云OCR 和 千问VL-OCR 两大云端识别引擎,无需本地安装任何 OCR 程序。
特别适合以下场景:
- 处理 Blu-ray 光盘提取的 SUP 格式字幕和从DVD提取的sub+idx格式字幕。
- 字幕文字模糊、嵌入图片,需要 OCR 重新识别
- 批量处理大量字幕文件
- 精细校对双语字幕的换行符位置
(截图位置1:程序主界面全貌,窗口大小约 1400×900,包含工具栏和模式一表格)
═══════════════════════════════════════════════
二、安装与启动
2.1 下载与解压
下载压缩包 SubtitleOCR_v110_Portable.zip,解压到任意位置即可使用。注意路径中 不要包含中文和空格,建议直接放在桌面或 D 盘根目录。
文件夹结构如下:
| SubtitleOCRTool_v110.exe | 主程序(双击运行) |
| 启动程序.bat | 带 Java 检测的启动脚本(初次推荐使用) |
| BDSup2Sub.jar | Blu-ray SUP 字幕转换工具(可选) |
| Java/ | Java 运行时环境(可选,如处理 SUP 字幕需安装) |
| logs/ | 日志目录,程序运行后自动创建 |
| README.md | 使用说明 |
2.2 启动方式
方式一(初次推荐):双击 启动程序.bat
方式二:双击 SubtitleOCRTool_v110.exe
首次使用 Blu-ray SUP 字幕功能时,脚本会提示安装 Java。
(截图位置2:双击”启动程序.bat”后的弹窗,提示”Java 检测中…”或”Java 已就绪”)
═══════════════════════════════════════════════
三、界面布局总览
(截图位置3:标注各区域名称的界面截图)
| 区域 | 说明 |
| ① 模式切换 | 切换”模式一”和”模式二” |
| ② 工具栏 | 打开字幕、OCR引擎选择、字号调节、API设置、开始OCR、导出SRT等 |
| ③ 主表格 | 显示字幕内容的核心区域 |
| ④ 状态栏 | 显示当前状态和日志路径 |
═══════════════════════════════════════════════
四、OCR 引擎配置(必须先完成)
重要提示:在开始 OCR 识别之前,必须先配置至少一个 OCR 引擎的 API 密钥,否则所有 OCR 功能都无法使用。
4.1 点击工具栏的”API设置”按钮
点击后,工具栏下方会展开 API 设置面板:
(截图位置5:展开后的API设置面板,包含OCR引擎选择、AK/SK/Key输入框)
4.2 选择 OCR 引擎
在 OCR 下拉框中选择 百度云OCR 或 千问VL。
| 引擎 | 需要的密钥 | 申请地址 |
| 百度云OCR | API Key(AK)和 Secret Key(SK) | 百度智能云控制台 console.bce.baidu.com |
| 千问VL | DashScope Key | 阿里云百炼平台 dashscope.console.aliyun.com |
4.3 填写密钥并保存
百度云 OCR 配置步骤:
- 在百度智能云注册并登录
- 进入”安全认证”创建 Access Key,获得 AK 和 SK
- 将 AK 填入”百度 AK”输入框
- 将 SK 填入”百度 SK”输入框
千问 VL-OCR 配置步骤:
- 在阿里云百炼平台注册并登录
- 开通”视觉理解”服务
- 获取 DashScope API Key
- 将 Key 填入”千问 DashScope Key”输入框
密钥填写完成后,程序会 自动保存,下次启动时自动恢复,无需重复填写。
4.4 验证密钥是否有效
配置好密钥后,可以直接尝试加载一个字幕文件,然后点击”开始OCR”。如果提示”百度云认证失败”或”千问 Key 无效”,说明密钥有误,请检查填写是否正确。
(截图位置6:认证失败的错误弹窗)
═══════════════════════════════════════════════
五、字幕文件加载
点击工具栏的 打开字幕 按钮,选择需要处理的字幕文件。
支持加载的文件格式:
- Blu-ray SUP:蓝光碟提取的字幕(.sup),需要 Java 环境
- VobSub(SUB/IDX):DVD 提取的字幕格式(需 .sub 和 .idx 成对存在)
注意:本工具专为图片型字幕设计,用于对嵌入图片进行 OCR 识别。不支持纯文字型字幕(如 SRT、ASS、SSA)。加载字幕后,工具栏上的”开始OCR”按钮会变为可用状态。如果按钮仍然是灰色,请检查 OCR 引擎密钥是否已配置。
(截图位置7:”打开字幕”对话框,筛选器显示支持的格式)
═══════════════════════════════════════════════
六、模式一:表格编辑模式
6.1 适用场景
模式一是 精细校对模式,适合以下情况:
- 字幕量不多,需要逐条认真校对
- 需要精确调整每条字幕的换行符位置
- 需要频繁使用”查找替换”功能
- 只需要对部分字幕进行 OCR,其余手动编辑
6.2 表格列说明
(截图位置8:模式一加载字幕后的表格全貌,标注各列名称)
| 列名 | 说明 | 可编辑 |
| 序号 | 字幕条目的序号(1, 2, 3…) | 否 |
| 开始时间 | 字幕开始时间(HH:MM:SS,mmm) | 否 |
| 结束时间 | 字幕结束时间 | 否 |
| 时长 | 该条字幕的持续时长(计算得出) | 否 |
| 图片 | 字幕对应的图像预览缩略图 | 否 |
| 校对 | 可编辑的文字内容,即最终导出内容 | 是 |
小提示:对于 VobSub 格式字幕,程序会自动提取嵌入的图片并显示在该列;如果没有图片,则显示为空白。
6.3 右键菜单功能
在表格任意位置右键点击,会弹出快捷菜单:
(截图位置9:模式一右键菜单截图)
| 菜单项 | 功能说明 |
| ↩ 插入换行符 // | 在当前行末尾插入双斜线分隔符(用于标注双行字幕时的换行位置) |
| 清空校对文字 | 将校对列清空 |
| 还原原文 | 将校对列恢复为原始字幕文字 |
| 设置开始时间 | 将前一条字幕的结束时间设为当前条的开始时间(批量修整时间轴用) |
| 合并下一条 | 将当前条和下一条字幕合并为一条 |
| 删除当前条 | 删除当前选中的字幕条目 |
| OCR 识别(当前条) | 仅对当前一条字幕的图片进行 OCR,结果写入校对列 |
| 查找… | 打开查找对话框 |
| 替换… | 打开查找替换对话框 |
6.4 在校对列编辑状态下插入 //
重要新功能(v1.0.9):双击校对列的单元格进入编辑模式后,在编辑状态下右键点击,同样会弹出自定义中文菜单,第一项就是”↩ 插入换行符 //“。
(截图位置10:双击进入编辑模式后,右键菜单显示自定义内容,含”插入换行符 //”选项)
如果选中了部分文字,点击”插入换行符 //”会将选中文本替换为” //”;如果没有选中文本,则在光标位置插入” //”。
6.5 单条 OCR
如果只需要对某一条字幕进行识别,可以:
- 在表格中选中该行
- 右键点击,选择”OCR 识别(当前条)”
该功能无需提取全部图片,响应更快,适合少量修正。
6.6 查找替换
右键选择”查找…”或”替换…”,弹出对话框:
(截图位置11:查找替换对话框截图)
| 对话框字段 | 说明 |
| 查找内容 | 输入要搜索的文字 |
| 替换为 | 输入替换后的文字 |
| 区分大小写 | 勾选后区分大小写 |
| 区分全半角 | 勾选后区分全角和半角字符 |
点击”查找下一个”高亮定位,点击”全部替换”批量处理。
6.7 字体大小调节
工具栏右侧有字号下拉框,可以调整表格内文字的大小(10~20pt),默认12pt。此设置只影响校对列,不影响时间戳和小标题显示。
(截图位置12:字号下拉框的位置和可选字号列表)
═══════════════════════════════════════════════
七、模式二:批量OCR模式
7.1 适用场景
模式二是 效率优先模式,适合以下情况:
- 字幕量大,需要快速批量处理
- 所有字幕都需要 OCR 识别
- 希望一键完成提取图片+OCR+填入表格
7.2 表格列说明
(截图位置13:模式二加载字幕后的表格全貌,6列布局)
| 列名 | 说明 |
| 序号 | 字幕条目序号 |
| 开始时间 | 开始时间戳 |
| 结束时间 | 结束时间戳 |
| 时长 | 持续时长 |
| 图片 | 字幕图片预览(可拖拽调整列宽) |
| 校对 | OCR 识别结果,双击可编辑 |
7.3 工作流程
第一步:切换到模式二
点击”模式二”单选按钮,界面会切换到模式二的表格布局。
(截图位置14:切换到模式二后,工具栏多出”提取图片”按钮)
第二步:点击”提取图片”
点击后,程序会从字幕文件中批量提取所有嵌入的图片。进度条会显示提取进度:
(截图位置15:提取图片进度条,显示”正在提取图片… X%”)
提取完成后,图片列会自动填充缩略图,表格变为6列完整状态。此时”开始OCR”按钮变为可用状态。
第三步:点击”开始OCR”
程序会依次对所有图片进行 OCR 识别。识别过程中:
- 进度条显示整体进度(批量OCR)
- 表格中每条字幕的”校对”列会实时显示识别结果
- 千问引擎每识别10条会休息3秒,防止接口限流
(截图位置16:批量OCR进行中的截图,进度条在某百分比,校对列已有文字填充)
OCR 完成后,弹出提示框”OCR 批量识别完成!”。
7.4 识别结果修正
批量 OCR 完成后,如果发现某条识别结果不准确:
- 双击该行的”校对”列,直接编辑文字
- 在编辑状态下,右键可使用”插入换行符 //”功能(v1.0.9 新增)
7.5 再次提取图片(刷新)
如果加载字幕后想重新提取图片(字幕文件被外部修改过),直接再次点击”提取图片”即可覆盖。
═══════════════════════════════════════════════
八、关于 // 换行符的说明
8.1 什么是双斜线 //
很多双语字幕中,一行显示两句话,中间用 // 分隔,表示”上半行显示A,下半行显示B”。例如:
我在优秀的父母面前 // 默默接受了这一切
在 Subtitle Edit 中打开时,会显示为:
| 我在优秀的父母面前 |
| 默默接受了这一切 |
8.2 工具自动处理
OCR 引擎返回的图片如果是多行文字,程序会自动清理返回的换行符,并插入 // 作为双行分隔符。对于千问引擎,如果返回了 `// //` 这样的重复斜线,程序会自动合并为单个 //。
8.3 手动插入 //
在模式一或模式二中,可以:
- 右键菜单 → ↩ 插入换行符 //:在行末追加 //
- 编辑模式下右键菜单 → ↩ 插入换行符 //:在光标处插入(或替换选中文本)
═══════════════════════════════════════════════
九、导出 SRT
完成所有校对后,点击工具栏的 导出SRT 按钮。
(截图位置17:导出SRT对话框)
| 对话框字段 | 说明 |
| 保存位置 | 默认保存在原字幕文件所在目录 |
| 文件名 | 默认使用原字幕文件名,末尾自动加”_ocr”后缀 |
点击保存后,程序将校对列的文字按 SRT 格式输出(保留原时间轴),覆盖保存到指定位置。
重要:校对列有内容的行才导出,完全空白的行会被跳过。
═══════════════════════════════════════════════
十、 Blu-ray SUP 字幕特殊说明
如果需要处理 Blu-ray 光盘提取的 SUP 格式字幕:
第一步:安装 Java
SUP 字幕的解码依赖 BDSup2Sub.jar,该工具需要 Java 环境才能运行。
- 运行”启动程序.bat”,如果检测到未安装 Java,会提示下载
- 点击提示中的下载链接,前往 java.com 下载并安装
- 安装完成后重启电脑
第二步:加载 SUP 文件
点击”打开字幕”,选择 .sup 文件。程序会自动调用 BDSup2Sub.jar 将其转换为 VobSub 格式,然后解码显示图片。
SUP 字幕处理流程:
| 步骤 | 说明 |
| 1 | 调用 BDSup2Sub.jar 转换为 VobSub |
| 2 | 程序内置 Python 解码器读取 VobSub |
| 3 | 提取 SPU 图像数据,渲染显示 |
| 4 | 生成字幕条目列表 |
注意:如果程序目录中有 Java 文件夹(便携版自带),程序会优先使用自带的 Java,无需额外安装。如果未检测到 Java,则跳过 BDSup2Sub 转换,直接提示 SUP 解码失败。
(截图位置18:成功加载 SUP 字幕后的界面,显示 Blu-ray 格式识别成功)
═══════════════════════════════════════════════
十一、常见问题
Q1:提示”百度云认证失败”
A:请检查 AK 和 SK 是否填写正确,密钥是否有权限,建议到百度云控制台重新创建一对密钥再试。
Q2:提示”请填写百度云 API Key”
A:这是因为 OCR 引擎选择为”百度云OCR”,但没有填写密钥。请先展开”API设置”面板,正确填写 AK 和 SK。
Q3:SUP 字幕加载失败
A:请确认是否已安装 Java。如果未安装,运行”启动程序.bat”按提示下载安装。
Q4:OCR 识别结果出现乱码
A:可能是图片分辨率过低或文字过小,可以尝试换用另一个 OCR 引擎(百度→千问,或反之)对比效果。
Q5:表格列宽不适应,图片显示不全
A:可以直接拖拽列标题边缘调整宽度,程序会自动缩放图片以适应列宽。
Q6:批量OCR中途停止后,想重新开始
A:点击工具栏的”停止”按钮,然后再次点击”开始OCR”即可重新开始。
═══════════════════════════════════════════════
十二、版本历史
| 版本 | 日期 | 更新内容 |
| v1.1.0 | 2026-04-02 | 修复1.模式二式二字号设置无效;2.编辑状态字号不跟随;3.模式二初始填充字号不对 |
| v1.0.9 | 2026-04-02 | 修复模式二序号两列显示问题;修复千问OCR双斜线残留问题;新增编辑状态自定义右键菜单(含插入 // 功能) |
| v1.0.8 | 2026-04-02 | 修复 // // 双斜线清理逻辑;新增查找替换功能;模式一时长列加宽;批量OCR增加休息机制 |
| v1.0.7 | 2026-04-02 | 新增千问OCR双斜线清理后处理 |
| v1.0.6 | 2026-04-02 | 图片智能裁剪优化;批量OCR多行分组逻辑增强 |
| v1.0.5 | 2026-04-02 | 新增右键”插入换行符 //”;行高增大 |
| v1.0.3 | 2026-04-02 | 模式一切换优化;加载进度条;修复模式二闪退 |
| v1.0.1 | 2026-04-02 | 修复 PyQt6 导入问题;清理临时文件夹 |
| v1.0.0 | 2026-04-01 | 整合版发布,模式一+模式二双模式 |
下载链接
123云盘
SubtitleOCR字幕工具 v1 保姆级使用教程(附下载链接) – 技术交流区 – YzYY – 高清视频修复论坛 – Powered by Discuz!
═══════════════════════════════════════════════
技术支持
开发者:慕静安
网站:www.yzyy.org
如有问题请前往网站发帖反馈。
感谢使用 SubtitleOCR 字幕工具,祝使用愉快!