Skip to content

快如闪电的硬字幕提取工具。仅需苹果M1芯片或英伟达3060显卡即可达到10倍速提取。A very fast tool for video hardcode subtitle extraction

License

Notifications You must be signed in to change notification settings

nhjydywd/SubtitleOCR

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

55 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

望言OCR

望言OCR是一款快如闪电的硬字幕提取工具,旨在加速AI时代下的视频硬字幕数据挖掘工作。

您只需一台具有普通M芯片的Mac,或者一台搭载3060级别显卡的Windows电脑,便能达到10倍速以上的硬字幕提取速度。

Mac用户:

点此处下载mac版APP

Windows用户:

点此处下载Windows版APP

已确认的最低可运行配置:Win10(22H2) + i5-7200U + NVIDIA MX150(较慢,约1.1倍速)

如果您遇到闪退问题,更新VC++库即可解决:https://aka.ms/vs/17/release/vc_redist.x64.exe

使用教程

可在哔哩哔哩观看使用教程(Windows/MacOS通用)。

性能

开发望言OCR的核心出发点是优化硬字幕提取的速度。通过将硬字幕提取拆分成”解码“、”检测“、”识别“三个完全并行的阶段,并充分利用AI推理引擎,实现了硬字幕提取速度的大幅提升。

下面是一个性能测试的结果,测试视频为一段45分钟的含有中英双语字幕的mp4视频:(x后面的数字表示能达到几倍速)

测试平台 VSE 雨伞OCR 望言OCR
M1 Macbook Air x1.6 x2.4 x10.5
M2 Macbook Air x1.8 x2.9 x14.9
M3 Macbook Pro x2.1 x3.5 x21.7
NVIDIA RTX 3060(with Intel I5 12400) x3.3 x4.2 x15.2
NVIDIA RTX 4070(with AMD R7 5800X) x4.7 x5.9 x24.1

您实际运行的速度可能受具体视频、CPU性能和GPU型号的影响,但不会有太多偏差。

QQ群

如遇使用问题,或有功能建议,欢迎加入QQ群:960402870

修改与定制

如需二次开发,请见此处教程

鸣谢

PaddleOCR:https://github.com/PaddlePaddle/PaddleOCR

About

快如闪电的硬字幕提取工具。仅需苹果M1芯片或英伟达3060显卡即可达到10倍速提取。A very fast tool for video hardcode subtitle extraction

Topics

Resources

License

Stars

Watchers

Forks