-
Notifications
You must be signed in to change notification settings - Fork 59
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
请问如何识别中文字符? #54
Comments
您好,只需要修改一下config.py里面的CHAR_VECTOR就可以了,改成中文字符 |
这个都可以,只要和ICDAR15的标注格式相同就可以 |
这个问题感觉是在数据读入那里,识别的label有点问题,可能要调试一下才知道 |
WE´RE |
您好,那个是正常的,那个单引号和带上标的E确实都是CHAR_VECTOR中没有。顺时针标注通过下标转换一下就可以变成逆时针吧,我记得EAST的数据处理代码里处理过顺时针的问题,好像直接用顺时针坐标也没问题,您可以试一下。 |
您好,请问是不是文字区域太多了呢,NMS比较耗时,我记得代码里面有计算每个模块的时间,您看一下。我这里网络有点问题看不到您的附图,抱歉, |
这个问题之前也有人反应过,我觉得您可以交给识别的时候先控制一下roi的数量,从32开始递增一下,看看速度变换,之后可以通过循环,把很多框分批次交给识别,没准会快一些。 |
您说的这一点我在代码里看到了,我变换了一下感觉区别并不是很大,并且我们的数据在nms以后的roi个数基本都会在32个以下。然而当把字符数目由5500多变到200多个时,识别的时间大幅下降,由先前的200多秒下降到了5秒左右,这个是解码部分造成的吗?为什么会有如此大的差别呀? |
这个应该就是识别部分的原因了,我也不太清楚为什么会这样,您可以单独试一下CRNN,看看有没有这个问题。 |
请问 打印substring 语句出现在哪呢,我想把它关掉 |
您好,您是指这里吧 |
是的,谢谢 |
你好,我训练中文时config.py都配置好的,训练时各个loss正常的,但为啥测试时detection 正常,而后面什么文本都没有预测到呢,请问可能哪里出了问题,我测试甚至用的训练集里的数据。 |
请问如何修改成中文字符,把所有的汉字都列一遍吗? |
你好,我想在你提供是模型上继续训练中文数据集,但是改动了config文件的字符数量,调用预训练时总是提示 |
你好能分享一下你的中文数据集和预训练模型吗!谢谢。[email protected] |
我也遇到了这个问题,请问你解决了吗 |
我的任务主要是中文的,套用这个方法如何实现呢?
The text was updated successfully, but these errors were encountered: