基于tesseract+opencv,实现摄像头扫描识别中国二代身份证
demo主要提供思路,通过摄像头取景,预览裁剪,ocr识别.
- 姓名
- 民族
- 性别
- 出生日期
- 家庭住址
- 身份证号码
1.对chi_sim.tessdata进行训练,目前用的文件为原始汉字语言库数据,没有针对二代身份证进行优化,如果只需要识别身份证号码,可以自己进行训练,只识别1-0和英文X。数据包也会相应减小。( baseApi.setVariable("tessedit_char_whitelist", "0123456789Xx");)也可以设置白名单,代码里设置了,但是这样没有减少训练文件的大小. 2.目前demo仅仅识别了身份证正面的信息,可后续进行优化....
V0.0.1(2017/7/21)
- 项目导入