網站可能被墻,請記住以下域名:subhd.cc subhd.me
分享一个自制的硬字幕OCR工具 - SubAIOCR
E
ezatgz
2025年9月26日 21:26

SubAIOCR - 视频字幕OCR工具

一个基于PaddleOCR PP-OCRv5的现代化硬字幕识别工具,与VideoSubFinder字幕提取工具完美配合使用。用于对从视频中提取的字幕图片进行OCR识别,最终生成SRT字幕文件。该工具已集成PaddleOCR模型文件,无需网络连接。 下载链接:https://www.alipan.com/s/pgBFFkXoK74


PP-OCRv5 是百度推出的高效、精准的文字识别模型。模型基于两阶段处理流程,专门用在快速、准确地检测和识别图像中的文字。模型参数量仅为0.07亿,体积小、效率高,在CPU和边缘设备上表现优异,每秒能处理370多个字符。模型支持简体中文、繁体中文、英文、日文和拼音等5种文字类型,能识别40多种语言。


核心功能

**现代化图形界面** - 直观易用的操作界面,所有操作在一个页面完成
**批量OCR识别** - 支持大量字幕图片的批量处理
**一键生成SRT** - 一键生成标准SRT字幕文件
**高效快捷键** - 丰富的键盘快捷键支持
**PP-OCRv5模型** - 集成最新PP-OCRv5模型,识别准确率高,无需联网运行
**多语言支持** - 支持简体中英、繁体中文、日文和英文文字识别

使用方法

1. 启动程序
2. 配置设置 :
- 选择输入目录(包含VideoSubFinder等工具导出的字幕图片)
- 选择输出目录(保存识别结果和SRT文件)
- 调整文本检测边长限制(根据图片质量选择)
- 选择喜欢的颜色主题
- 开启/关闭界面音效
3. 开始识别 :
- 点击"开始OCR"按钮进行批量识别
- 实时查看识别进度和结果并对识别出的字幕文本进行必要的编辑
4. 生成字幕 :
- 识别完成后点击"生成SRT"按钮
- 自动生成标准SRT字幕文件

快捷键操作

| 快捷键 | 功能 | 说明 |
|--------|------|------|
| 方向键 | 导航 | 在字幕列表中快速移动 |
| `空格键` | 选择切换 | 选择/取消选择当前字幕项 |
| `回车键` | 编辑模式 | 进入字幕文本编辑状态 |
| `Esc` | 退出编辑 | 退出编辑模式,保存更改 |
| `Delete` | 删除项目 | 删除当前选中的字幕项 |
| `PageUp/PageDown` | 翻页 | 快速翻页浏览 |
| `Home/End` | 首尾项跳转 | 跳转到页面首部/尾部 |
| `Ctrl+Home` | 首尾页跳转 | 跳转到首页 |
| `Ctrl+End` | 首尾页跳转 | 跳转到末页 |



性能说明

硬件配置 - 该配置约为2018年中端笔记本的配置。工具运行在机械硬盘上,输入输出文件也位于机械硬盘上

- 处理器: Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz
- 内存: 16.0 GB
- 存储: 466 GB HDD 5400RPM

- 识别速度 - 纯中文字幕识别50张图片耗时约13秒,100张图片耗时约27秒。性能表现一致且平稳
- 内存占用 - 运行中占用内存峰值约800MB左右
- CPU占用 - 识别过程中CPU占用率在90%以上,对其它操作可能有一定影响
發表留言 共 5 条

Allion
感谢分享
2025-10-10 11:08

蒙太奇字幕组
看得出你非常用心,投入很多心血,这对很多人都能起到实质性帮助,真心感谢你的付出和分享!祝项目维护顺利,越来越好!有什么开发上需要帮忙的也欢迎互相交流。 -- 小p
2025-10-1 02:29

Z
zpwz
感谢分享。试用下,操作简单---- 优点:识别准确,速度快。 不足:一行的字幕,会出现识别成两行或三行(120条字幕,约出现十来条成三行的)。
2025-9-27 00:59
E
ezatgz
感谢提供的反馈。这个问题我知道是存在的。这是由于引擎本身的问题导致的。可以尝试以下几种解决办法: 1. 将文字检测边长限制调整为1920,重新对所有图片重新扫描。应该可以减少换行的出现。调整为1920,扫描速度会稍慢。 2. 如果出现的条目不多,可以将文字检测边长限制调整为1920,然后双击识别出现多行文字的图片,这会单独对该图片重新扫描。 3. 直接在工具栏点删除所有换行符(这个功能就是针对识别多行添加的) 另外,你的字幕图片宽度是多少像素?文字检测边长限制尽可能大于图片宽度。
2025-9-27 11:16

E
ezatgz
**现代化图形界面** - 直观易用的操作界面,所有操作在一个页面完成 **批量OCR识别** - 支持大量字幕图片的批量处理 **一键生成SRT** - 一键生成标准SRT字幕文件 **高效快捷键** - 丰富的键盘快捷键支持 **PP-OCRv5模型** - 集成最新PP-OCRv5模型,识别准确率高,无需联网运行 **多语言支持** - 支持简体中英、繁体中文、日文和英文文字识别
2025-9-26 21:28

最新評論
SubHD 0.006