feat(ocr): 支持更换ocr引擎为onnxocr#1482
Conversation
|
切换后逢魔任务将右下角的剩余次数 0/4 识别为 80/4,换回 ppocr 则解决 |
排查了下,原因是当前的检测框(ROI)有点偏大,把左边边缘的一点文字作为干扰项框进去了 有两种方案
我自己的代码库里是增加了一个转灰度图的预处理,因为对于文字识别而言,轮廓和对比度特征远比颜色信息重要,这能有效提升ocr的准确率。考虑到 ppocr 内部可能已经有自己的处理逻辑,为了避免会造成影响,我把这个灰度图转换实现在包装层(Wrapper) |
|
可以的,逢魔之时已经可以正确识别为 0/4,回头有空我再调整 ROI 吧咕 |
|
ppocr 是这样
|
|
一样的问题,还是全用灰度图吧 |
哈哈哈好,我继续测试 |
|
切换ocr底层引擎的收益具体是什么呢。更快的速度?更高的精度?有测试吗 |
Findings
|
有的兄弟,有的。我从上面拉取完之后一直用着,文字识别准确度高了许多,之前识别不出来的字都能出了 |
啊 sorry ,因为这个当时在开发群聊了挺久的了,然后开发群里也有挺多人换成这个了,我就默认大家都是知道的,而忘记解释我这个pr的意义了。 目前比较直观的感受是精度提高很多,例如很多时候我们需要对ocr的结果进行replace,换成这个引擎可以省去大部分这种无意义的工作,再例如活动门票的识别,ppocr经常会出现明明还有门票,但是结束任务的情况。 速度方面没具体测算过,但是体感上没大的差别,且如果有需要,我可以提供使用gpu推理的部署文档。 |



时间原因,测试的比较少,有问题可以提