请问如何识别中文字符？ #54

clare96 · 2020-06-19T09:50:41Z

我的任务主要是中文的，套用这个方法如何实现呢？

Pay20Y · 2020-06-20T02:28:55Z

您好，只需要修改一下config.py里面的CHAR_VECTOR就可以了，改成中文字符

Pay20Y · 2020-06-22T12:07:59Z

这个都可以，只要和ICDAR15的标注格式相同就可以

Pay20Y · 2020-06-23T13:19:05Z

这个问题感觉是在数据读入那里，识别的label有点问题，可能要调试一下才知道

clare96 · 2020-06-28T05:38:10Z

WE´RE
substring not found
Step 000510, detect_loss 0.0131, recognize_loss 22.3125, total loss 0.4936, 1.15 seconds/step, 10.43 examples/second
Step 000520, detect_loss 0.0163, recognize_loss 20.3499, total loss 0.4768, 0.96 seconds/step, 12.50 examples/second
Step 000530, detect_loss 0.0267, recognize_loss 21.5296, total loss 0.4985, 0.86 seconds/step, 14.00 examples/second
CAFÉ
substring not found
Step 000540, detect_loss 0.0214, recognize_loss 19.2192, total loss 0.4696, 0.96 seconds/step, 12.52 examples/second
World´s
substring not found
请问在训练的过程中经常出现substring not found，这个是正常的吗？

Pay20Y · 2020-06-29T01:48:15Z

您好，那个是正常的，那个单引号和带上标的E确实都是CHAR_VECTOR中没有。顺时针标注通过下标转换一下就可以变成逆时针吧，我记得EAST的数据处理代码里处理过顺时针的问题，好像直接用顺时针坐标也没问题，您可以试一下。

clare96 · 2020-07-07T03:12:15Z

您好，我们用您代码在自己的数据集上进行了训练和测试，训练的时候使用的是5540个中文字符。请问为什么识别的时间会如此之慢？我们已经调用了GPU

Pay20Y · 2020-07-07T13:30:01Z

您好，请问是不是文字区域太多了呢，NMS比较耗时，我记得代码里面有计算每个模块的时间，您看一下。我这里网络有点问题看不到您的附图，抱歉，

Pay20Y · 2020-07-07T14:14:28Z

这个问题之前也有人反应过，我觉得您可以交给识别的时候先控制一下roi的数量，从32开始递增一下，看看速度变换，之后可以通过循环，把很多框分批次交给识别，没准会快一些。

clare96 · 2020-07-08T05:24:08Z

您说的这一点我在代码里看到了，我变换了一下感觉区别并不是很大，并且我们的数据在nms以后的roi个数基本都会在32个以下。然而当把字符数目由5500多变到200多个时，识别的时间大幅下降，由先前的200多秒下降到了5秒左右，这个是解码部分造成的吗？为什么会有如此大的差别呀？

Pay20Y · 2020-07-09T07:56:26Z

这个应该就是识别部分的原因了，我也不太清楚为什么会这样，您可以单独试一下CRNN，看看有没有这个问题。

yuanjiXiang · 2020-11-19T06:09:41Z

您好，那个是正常的，那个单引号和带上标的E确实都是CHAR_VECTOR中没有。顺时针标注通过下标转换一下就可以变成逆时针吧，我记得EAST的数据处理代码里处理过顺时针的问题，好像直接用顺时针坐标也没问题，您可以试一下。

请问打印substring 语句出现在哪呢，我想把它关掉

Pay20Y · 2020-11-19T06:17:32Z

您好，那个是正常的，那个单引号和带上标的E确实都是CHAR_VECTOR中没有。顺时针标注通过下标转换一下就可以变成逆时针吧，我记得EAST的数据处理代码里处理过顺时针的问题，好像直接用顺时针坐标也没问题，您可以试一下。

请问打印substring 语句出现在哪呢，我想把它关掉

您好，您是指这里吧

yuanjiXiang · 2020-11-19T06:45:00Z

您好，那个是正常的，那个单引号和带上标的E确实都是CHAR_VECTOR中没有。顺时针标注通过下标转换一下就可以变成逆时针吧，我记得EAST的数据处理代码里处理过顺时针的问题，好像直接用顺时针坐标也没问题，您可以试一下。

请问打印substring 语句出现在哪呢，我想把它关掉

您好，您是指这里吧

是的，谢谢

yuanjiXiang · 2020-11-20T08:44:47Z

这个问题感觉是在数据读入那里，识别的label有点问题，可能要调试一下才知道

你好，我训练中文时config.py都配置好的，训练时各个loss正常的,但为啥测试时detection 正常,而后面什么文本都没有预测到呢,请问可能哪里出了问题，我测试甚至用的训练集里的数据。

wycrystal · 2021-08-18T08:30:57Z

您好，只需要修改一下config.py里面的CHAR_VECTOR就可以了，改成中文字符

请问如何修改成中文字符，把所有的汉字都列一遍吗？

laofeiwei · 2022-02-16T03:29:31Z

据集上进行了训练和测试，训练的时候使用的是5540个中文字符。请问为什么识别的时间会如此之慢？我们已经调用了GPU

你好,我想在你提供是模型上继续训练中文数据集,但是改动了config文件的字符数量,调用预训练时总是提示
Input to reshape is a tensor with 48640 values, but the requested shape has 3067392
这是什么原因,我无法改动你提供的模型的输出层形状.

SkrDrag · 2022-04-25T04:12:16Z

这个问题感觉是在数据读入那里，识别的label有点问题，可能要调试一下才知道

你好，我训练中文时config.py都配置好的，训练时各个loss正常的,但为啥测试时detection 正常,而后面什么文本都没有预测到呢,请问可能哪里出了问题，我测试甚至用的训练集里的数据。

你好能分享一下你的中文数据集和预训练模型吗！谢谢。[email protected]

SkrDrag · 2022-04-29T05:50:53Z

这个问题感觉是在数据读入那里，识别的label有点问题，可能要调试一下才知道

你好，我训练中文时config.py都配置好的，训练时各个loss正常的,但为啥测试时detection 正常,而后面什么文本都没有预测到呢,请问可能哪里出了问题，我测试甚至用的训练集里的数据。

我也遇到了这个问题，请问你解决了吗

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问如何识别中文字符？ #54

请问如何识别中文字符？ #54

clare96 commented Jun 19, 2020

Pay20Y commented Jun 20, 2020

Pay20Y commented Jun 22, 2020

Pay20Y commented Jun 23, 2020

clare96 commented Jun 28, 2020

Pay20Y commented Jun 29, 2020

clare96 commented Jul 7, 2020

Pay20Y commented Jul 7, 2020 •

edited

Loading

Pay20Y commented Jul 7, 2020

clare96 commented Jul 8, 2020

Pay20Y commented Jul 9, 2020

yuanjiXiang commented Nov 19, 2020

Pay20Y commented Nov 19, 2020

yuanjiXiang commented Nov 19, 2020

yuanjiXiang commented Nov 20, 2020

wycrystal commented Aug 18, 2021

laofeiwei commented Feb 16, 2022

SkrDrag commented Apr 25, 2022

SkrDrag commented Apr 29, 2022

请问如何识别中文字符？ #54

请问如何识别中文字符？ #54

Comments

clare96 commented Jun 19, 2020

Pay20Y commented Jun 20, 2020

Pay20Y commented Jun 22, 2020

Pay20Y commented Jun 23, 2020

clare96 commented Jun 28, 2020

Pay20Y commented Jun 29, 2020

clare96 commented Jul 7, 2020

Pay20Y commented Jul 7, 2020 • edited Loading

Pay20Y commented Jul 7, 2020

clare96 commented Jul 8, 2020

Pay20Y commented Jul 9, 2020

yuanjiXiang commented Nov 19, 2020

Pay20Y commented Nov 19, 2020

yuanjiXiang commented Nov 19, 2020

yuanjiXiang commented Nov 20, 2020

wycrystal commented Aug 18, 2021

laofeiwei commented Feb 16, 2022

SkrDrag commented Apr 25, 2022

SkrDrag commented Apr 29, 2022

Pay20Y commented Jul 7, 2020 •

edited

Loading