[PaddlePaddle/PaddleOCR]OCR识别错误

2024-05-15 208 views
8

paddleocr==2.6.1.0

paddle ocr 识别,图片中的字母“F”被识别为“E”

ocr = PaddleOCR(use_angle_cls=True, lang='en',use_gpu=False, det_limit_side_len=1280 ) img_path = 'IMG-20220304-WA0000.jpg' preds = ocr.ocr(img_path, cls=True)

image

回答

7

建议换精度更高的模型

3

现在使用的应该是精度最高的模型了吧。 @jingsongliujing 精度更高的模型是指??

image

8

通用模型有v3版本吗?

0

你看截图

6

谢谢

1

感谢反馈,可以先试一下上面那个大模型,我们后续会进行针对优化

8

试了下大的模型,解决了F识别为E的问题。

大的模型发现另外一个问题,'W'识别为‘N',但并不是所有的‘W’都识别为‘E’,只在其中一个图片中W被错误识别了; 是不是可以参赛来改善呢? image

6

还发现对于半角括号的识别也有问题。 如果使用lang='en‘模型,括号无法识别, 如果使用lang='ch'模型,半角括号被识别为全角括号。

image

4

这个建议你预处理一下图片

7

怎么处理?