-
Notifications
You must be signed in to change notification settings - Fork 23
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
FOTS中文数据训练实践 #22
Comments
@ivoxx 谢了~ |
您好,关于中文识别,能看一下您的common_str.py怎么设置的吗? |
@471417367 就是常见的汉字. |
@ivoxx 你好,你输入crnn部分的中文识别高度为多少? img_h参数 |
|
@ivoxx 多谢回复。 |
@WeihongM lstm通道数设为256 , 其他config参数基本没变 |
谢谢你的建议,对于中文来说,预训练真的很重要 |
@ivoxx 你好,我想问一下第三步应该怎么做呢?骨干网是指RESNET吗?是在哪个数据集上进行预训练呢? |
@GaroneHuang 把检测分支屏蔽掉训练骨干网,骨干网可以是RESNET,我使用的是自己合成的中文数据 |
@ivoxx 您好,请问您能share一下您在中文数据集中预训练模型的权重吗,感谢 |
hi 训练这个模型有问题,有人可以帮我解答嘛 |
请问在一个中英文的场景中,应该用什么预训练模型,后续用什么中英数据集优化? |
1、首先将LSTM隐藏层数设置为256(1024的话,参数量会很夸张)。
2、检查训练图像预处理是否与自己的数据兼容。
3、先训练识别网络,得到骨干网及识别分枝的预训练模型。
4、更改网络结构,使检测和识别使用同一个骨干网,再利用3步的预训练模型进行联合训练。
5、EAST检测分枝,由于算法自身的限制,无法处理好长文本。如果想改善,可以把检测分枝更换为其他能够处理长文本的检测模型。
如果有中文端到端的问题,可以在这里进行讨论。
The text was updated successfully, but these errors were encountered: