SubtitleOCR字幕工具 保姆级使用教程

═══════════════════════════════════════════════
一、前言

本工具全称 SubtitleOCR 字幕工具·整合版,由 慕静安 开发(网站:www.yzyy.org)。它是一款 绿色单文件 字幕处理工具,集成了两种工作模式,支持 百度云OCR 和 千问VL-OCR 两大云端识别引擎,无需本地安装任何 OCR 程序。

特别适合以下场景:

  • 处理 Blu-ray 光盘提取的 SUP 格式字幕和从DVD提取的sub+idx格式字幕。
  • 字幕文字模糊、嵌入图片,需要 OCR 重新识别
  • 批量处理大量字幕文件
  • 精细校对双语字幕的换行符位置


(截图位置1:程序主界面全貌,窗口大小约 1400×900,包含工具栏和模式一表格)

═══════════════════════════════════════════════

二、安装与启动

2.1 下载与解压

下载压缩包 SubtitleOCR_v110_Portable.zip,解压到任意位置即可使用。注意路径中 不要包含中文和空格,建议直接放在桌面或 D 盘根目录。

文件夹结构如下:

SubtitleOCRTool_v110.exe 主程序(双击运行)
启动程序.bat 带 Java 检测的启动脚本(初次推荐使用)
BDSup2Sub.jar Blu-ray SUP 字幕转换工具(可选)
Java/ Java 运行时环境(可选,如处理 SUP 字幕需安装)
logs/ 日志目录,程序运行后自动创建
README.md 使用说明

2.2 启动方式

方式一(初次推荐):双击 启动程序.bat
方式二:双击 SubtitleOCRTool_v110.exe

首次使用 Blu-ray SUP 字幕功能时,脚本会提示安装 Java。

(截图位置2:双击”启动程序.bat”后的弹窗,提示”Java 检测中…”或”Java 已就绪”)

═══════════════════════════════════════════════

三、界面布局总览

(截图位置3:标注各区域名称的界面截图)

 

区域 说明
① 模式切换 切换”模式一”和”模式二”
② 工具栏 打开字幕、OCR引擎选择、字号调节、API设置、开始OCR、导出SRT等
③ 主表格 显示字幕内容的核心区域
④ 状态栏 显示当前状态和日志路径

 

═══════════════════════════════════════════════

四、OCR 引擎配置(必须先完成)

重要提示:在开始 OCR 识别之前,必须先配置至少一个 OCR 引擎的 API 密钥,否则所有 OCR 功能都无法使用。

4.1 点击工具栏的”API设置”按钮

点击后,工具栏下方会展开 API 设置面板:

(截图位置5:展开后的API设置面板,包含OCR引擎选择、AK/SK/Key输入框)

4.2 选择 OCR 引擎

在 OCR 下拉框中选择 百度云OCR 或 千问VL

引擎 需要的密钥 申请地址
百度云OCR API Key(AK)和 Secret Key(SK) 百度智能云控制台 console.bce.baidu.com
千问VL DashScope Key 阿里云百炼平台 dashscope.console.aliyun.com

4.3 填写密钥并保存

百度云 OCR 配置步骤:

  • 在百度智能云注册并登录
  • 进入”安全认证”创建 Access Key,获得 AK 和 SK
  • 将 AK 填入”百度 AK”输入框
  • 将 SK 填入”百度 SK”输入框

千问 VL-OCR 配置步骤:

  • 在阿里云百炼平台注册并登录
  • 开通”视觉理解”服务
  • 获取 DashScope API Key
  • 将 Key 填入”千问 DashScope Key”输入框

密钥填写完成后,程序会 自动保存,下次启动时自动恢复,无需重复填写。

4.4 验证密钥是否有效

配置好密钥后,可以直接尝试加载一个字幕文件,然后点击”开始OCR”。如果提示”百度云认证失败”或”千问 Key 无效”,说明密钥有误,请检查填写是否正确。


(截图位置6:认证失败的错误弹窗)

═══════════════════════════════════════════════

五、字幕文件加载

点击工具栏的 打开字幕 按钮,选择需要处理的字幕文件。

支持加载的文件格式:

  • Blu-ray SUP:蓝光碟提取的字幕(.sup),需要 Java 环境
  • VobSub(SUB/IDX):DVD 提取的字幕格式(需 .sub 和 .idx 成对存在)

注意:本工具专为图片型字幕设计,用于对嵌入图片进行 OCR 识别。不支持纯文字型字幕(如 SRT、ASS、SSA)。加载字幕后,工具栏上的”开始OCR”按钮会变为可用状态。如果按钮仍然是灰色,请检查 OCR 引擎密钥是否已配置。

(截图位置7:”打开字幕”对话框,筛选器显示支持的格式)

═══════════════════════════════════════════════

六、模式一:表格编辑模式

6.1 适用场景

模式一是 精细校对模式,适合以下情况:

  • 字幕量不多,需要逐条认真校对
  • 需要精确调整每条字幕的换行符位置
  • 需要频繁使用”查找替换”功能
  • 只需要对部分字幕进行 OCR,其余手动编辑

6.2 表格列说明

(截图位置8:模式一加载字幕后的表格全貌,标注各列名称)

列名 说明 可编辑
序号 字幕条目的序号(1, 2, 3…)
开始时间 字幕开始时间(HH:MM:SS,mmm)
结束时间 字幕结束时间
时长 该条字幕的持续时长(计算得出)
图片 字幕对应的图像预览缩略图
校对 可编辑的文字内容,即最终导出内容

小提示:对于 VobSub 格式字幕,程序会自动提取嵌入的图片并显示在该列;如果没有图片,则显示为空白。

6.3 右键菜单功能

在表格任意位置右键点击,会弹出快捷菜单:

(截图位置9:模式一右键菜单截图)

菜单项 功能说明
↩ 插入换行符 // 在当前行末尾插入双斜线分隔符(用于标注双行字幕时的换行位置)
清空校对文字 将校对列清空
还原原文 将校对列恢复为原始字幕文字
设置开始时间 将前一条字幕的结束时间设为当前条的开始时间(批量修整时间轴用)
合并下一条 将当前条和下一条字幕合并为一条
删除当前条 删除当前选中的字幕条目
OCR 识别(当前条) 仅对当前一条字幕的图片进行 OCR,结果写入校对列
查找… 打开查找对话框
替换… 打开查找替换对话框

6.4 在校对列编辑状态下插入 //

重要新功能(v1.0.9):双击校对列的单元格进入编辑模式后,在编辑状态下右键点击,同样会弹出自定义中文菜单,第一项就是”↩ 插入换行符 //“。

(截图位置10:双击进入编辑模式后,右键菜单显示自定义内容,含”插入换行符 //”选项)

如果选中了部分文字,点击”插入换行符 //”会将选中文本替换为” //”;如果没有选中文本,则在光标位置插入” //”。

6.5 单条 OCR

如果只需要对某一条字幕进行识别,可以:

  • 在表格中选中该行
  • 右键点击,选择”OCR 识别(当前条)”

该功能无需提取全部图片,响应更快,适合少量修正。

6.6 查找替换

右键选择”查找…”或”替换…”,弹出对话框:

(截图位置11:查找替换对话框截图)

对话框字段 说明
查找内容 输入要搜索的文字
替换为 输入替换后的文字
区分大小写 勾选后区分大小写
区分全半角 勾选后区分全角和半角字符

点击”查找下一个”高亮定位,点击”全部替换”批量处理。

6.7 字体大小调节

工具栏右侧有字号下拉框,可以调整表格内文字的大小(10~20pt),默认12pt。此设置只影响校对列,不影响时间戳和小标题显示。

(截图位置12:字号下拉框的位置和可选字号列表)

═══════════════════════════════════════════════

七、模式二:批量OCR模式

7.1 适用场景

模式二是 效率优先模式,适合以下情况:

  • 字幕量大,需要快速批量处理
  • 所有字幕都需要 OCR 识别
  • 希望一键完成提取图片+OCR+填入表格

 

7.2 表格列说明

(截图位置13:模式二加载字幕后的表格全貌,6列布局)

 

列名 说明
序号 字幕条目序号
开始时间 开始时间戳
结束时间 结束时间戳
时长 持续时长
图片 字幕图片预览(可拖拽调整列宽)
校对 OCR 识别结果,双击可编辑

 

7.3 工作流程

第一步:切换到模式二

点击”模式二”单选按钮,界面会切换到模式二的表格布局。

(截图位置14:切换到模式二后,工具栏多出”提取图片”按钮)

第二步:点击”提取图片”

点击后,程序会从字幕文件中批量提取所有嵌入的图片。进度条会显示提取进度:

(截图位置15:提取图片进度条,显示”正在提取图片… X%”)

提取完成后,图片列会自动填充缩略图,表格变为6列完整状态。此时”开始OCR”按钮变为可用状态。

第三步:点击”开始OCR”

程序会依次对所有图片进行 OCR 识别。识别过程中:

  • 进度条显示整体进度(批量OCR)
  • 表格中每条字幕的”校对”列会实时显示识别结果
  • 千问引擎每识别10条会休息3秒,防止接口限流


(截图位置16:批量OCR进行中的截图,进度条在某百分比,校对列已有文字填充)

OCR 完成后,弹出提示框”OCR 批量识别完成!”。

7.4 识别结果修正

批量 OCR 完成后,如果发现某条识别结果不准确:

  • 双击该行的”校对”列,直接编辑文字
  • 在编辑状态下,右键可使用”插入换行符 //”功能(v1.0.9 新增)

 

7.5 再次提取图片(刷新)

如果加载字幕后想重新提取图片(字幕文件被外部修改过),直接再次点击”提取图片”即可覆盖。

═══════════════════════════════════════════════

八、关于 // 换行符的说明

8.1 什么是双斜线 //

很多双语字幕中,一行显示两句话,中间用 // 分隔,表示”上半行显示A,下半行显示B”。例如:

我在优秀的父母面前 // 默默接受了这一切

在 Subtitle Edit 中打开时,会显示为:

我在优秀的父母面前
默默接受了这一切

 

8.2 工具自动处理

OCR 引擎返回的图片如果是多行文字,程序会自动清理返回的换行符,并插入 // 作为双行分隔符。对于千问引擎,如果返回了 `// //` 这样的重复斜线,程序会自动合并为单个 //。

8.3 手动插入 //

在模式一或模式二中,可以:

  • 右键菜单 → ↩ 插入换行符 //:在行末追加 //
  • 编辑模式下右键菜单 → ↩ 插入换行符 //:在光标处插入(或替换选中文本)

 

═══════════════════════════════════════════════

九、导出 SRT

完成所有校对后,点击工具栏的 导出SRT 按钮。

(截图位置17:导出SRT对话框)

 

对话框字段 说明
保存位置 默认保存在原字幕文件所在目录
文件名 默认使用原字幕文件名,末尾自动加”_ocr”后缀

 

点击保存后,程序将校对列的文字按 SRT 格式输出(保留原时间轴),覆盖保存到指定位置。

重要:校对列有内容的行才导出,完全空白的行会被跳过。

═══════════════════════════════════════════════

十、 Blu-ray SUP 字幕特殊说明

如果需要处理 Blu-ray 光盘提取的 SUP 格式字幕:

第一步:安装 Java

SUP 字幕的解码依赖 BDSup2Sub.jar,该工具需要 Java 环境才能运行。

 

  • 运行”启动程序.bat”,如果检测到未安装 Java,会提示下载
  • 点击提示中的下载链接,前往 java.com 下载并安装
  • 安装完成后重启电脑

 

第二步:加载 SUP 文件

点击”打开字幕”,选择 .sup 文件。程序会自动调用 BDSup2Sub.jar 将其转换为 VobSub 格式,然后解码显示图片。

SUP 字幕处理流程:

步骤 说明
1 调用 BDSup2Sub.jar 转换为 VobSub
2 程序内置 Python 解码器读取 VobSub
3 提取 SPU 图像数据,渲染显示
4 生成字幕条目列表

 

注意:如果程序目录中有 Java 文件夹(便携版自带),程序会优先使用自带的 Java,无需额外安装。如果未检测到 Java,则跳过 BDSup2Sub 转换,直接提示 SUP 解码失败。

(截图位置18:成功加载 SUP 字幕后的界面,显示 Blu-ray 格式识别成功)

═══════════════════════════════════════════════

十一、常见问题

Q1:提示”百度云认证失败”
A:请检查 AK 和 SK 是否填写正确,密钥是否有权限,建议到百度云控制台重新创建一对密钥再试。

Q2:提示”请填写百度云 API Key”
A:这是因为 OCR 引擎选择为”百度云OCR”,但没有填写密钥。请先展开”API设置”面板,正确填写 AK 和 SK。

Q3:SUP 字幕加载失败
A:请确认是否已安装 Java。如果未安装,运行”启动程序.bat”按提示下载安装。

Q4:OCR 识别结果出现乱码
A:可能是图片分辨率过低或文字过小,可以尝试换用另一个 OCR 引擎(百度→千问,或反之)对比效果。

Q5:表格列宽不适应,图片显示不全
A:可以直接拖拽列标题边缘调整宽度,程序会自动缩放图片以适应列宽。

Q6:批量OCR中途停止后,想重新开始
A:点击工具栏的”停止”按钮,然后再次点击”开始OCR”即可重新开始。

═══════════════════════════════════════════════

十二、版本历史

版本 日期 更新内容
v1.1.0 2026-04-02 修复1.模式二式二字号设置无效;2.编辑状态字号不跟随;3.模式二初始填充字号不对
v1.0.9 2026-04-02 修复模式二序号两列显示问题;修复千问OCR双斜线残留问题;新增编辑状态自定义右键菜单(含插入 // 功能)
v1.0.8 2026-04-02 修复 // // 双斜线清理逻辑;新增查找替换功能;模式一时长列加宽;批量OCR增加休息机制
v1.0.7 2026-04-02 新增千问OCR双斜线清理后处理
v1.0.6 2026-04-02 图片智能裁剪优化;批量OCR多行分组逻辑增强
v1.0.5 2026-04-02 新增右键”插入换行符 //”;行高增大
v1.0.3 2026-04-02 模式一切换优化;加载进度条;修复模式二闪退
v1.0.1 2026-04-02 修复 PyQt6 导入问题;清理临时文件夹
v1.0.0 2026-04-01 整合版发布,模式一+模式二双模式



下载链接

123云盘
SubtitleOCR字幕工具 v1 保姆级使用教程(附下载链接) – 技术交流区 – YzYY – 高清视频修复论坛 – Powered by Discuz!
═══════════════════════════════════════════════

技术支持

开发者:慕静安
网站:www.yzyy.org
如有问题请前往网站发帖反馈。

感谢使用 SubtitleOCR 字幕工具,祝使用愉快!

Tags:

发表回复

Your email address will not be published. Required fields are marked *.

*
*