[PaddlePaddle/PaddleOCR]OCR识别错误

paddleocr==2.6.1.0

paddle ocr 识别，图片中的字母“F”被识别为“E”

ocr = PaddleOCR(use_angle_cls=True, lang='en',use_gpu=False, det_limit_side_len=1280 ) img_path = 'IMG-20220304-WA0000.jpg' preds = ocr.ocr(img_path, cls=True)

jack-gits

建议换精度更高的模型

jingsongliujing

现在使用的应该是精度最高的模型了吧。 @jingsongliujing 精度更高的模型是指？？

jack-gits

这里建议用通用模型：https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/models_list.md

jingsongliujing

通用模型有v3版本吗？

jack-gits

你看截图

jingsongliujing

谢谢

jack-gits

感谢反馈，可以先试一下上面那个大模型，我们后续会进行针对优化

WenmuZhou

试了下大的模型，解决了F识别为E的问题。

大的模型发现另外一个问题，'W'识别为‘N'，但并不是所有的‘W’都识别为‘E’，只在其中一个图片中W被错误识别了；是不是可以参赛来改善呢？

jack-gits

还发现对于半角括号的识别也有问题。如果使用lang='en‘模型，括号无法识别，如果使用lang='ch'模型，半角括号被识别为全角括号。

jack-gits

这个建议你预处理一下图片

jingsongliujing

怎么处理？

jack-gits

[PaddlePaddle/PaddleOCR]OCR识别错误

回答