望言OCR是一款快如闪电的硬字幕提取工具,旨在加速AI时代下的视频硬字幕数据挖掘工作。
您只需一台具有普通M芯片的Mac,或者一台搭载3060级别显卡的Windows电脑,便能达到10倍速以上的硬字幕提取速度。
已确认的最低可运行配置:Win10(22H2) + i5-7200U + NVIDIA MX150(较慢,约1.1倍速)
如果您遇到闪退问题,更新VC++库即可解决:https://aka.ms/vs/17/release/vc_redist.x64.exe
可在哔哩哔哩观看使用教程(Windows/MacOS通用)。
开发望言OCR的核心出发点是优化硬字幕提取的速度。通过将硬字幕提取拆分成”解码“、”检测“、”识别“三个完全并行的阶段,并充分利用AI推理引擎,实现了硬字幕提取速度的大幅提升。
下面是一个性能测试的结果,测试视频为一段45分钟的含有中英双语字幕的mp4视频:(x后面的数字表示能达到几倍速)
测试平台 | VSE | 雨伞OCR | 望言OCR |
---|---|---|---|
M1 Macbook Air | x1.6 | x2.4 | x10.5 |
M2 Macbook Air | x1.8 | x2.9 | x14.9 |
M3 Macbook Pro | x2.1 | x3.5 | x21.7 |
NVIDIA RTX 3060(with Intel I5 12400) | x3.3 | x4.2 | x15.2 |
NVIDIA RTX 4070(with AMD R7 5800X) | x4.7 | x5.9 | x24.1 |
您实际运行的速度可能受具体视频、CPU性能和GPU型号的影响,但不会有太多偏差。
如遇使用问题,或有功能建议,欢迎加入QQ群:960402870
如需二次开发,请见此处教程。