请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem
- 系统环境/System Environment:Docker desktop,镜像是registry.baidubce.com/paddlepaddle/paddle:2.6.0-gpu-cuda11.7-cudnn8.4-trt8.4
- 版本号/Version:Paddle:v2.12
- PaddleOCR: v2.7
-使用模型为:ch_ppocr_mobile_v2.0_rec中的预训练模型 -修改配置文件中的batch_size,改为16 -修改字典,在原有的ppocr_keys_v1.txt基础上,新增几个生僻字 -数据集是用textRender合成的图片,用了12中背景,6种字体,18句包含新增生僻字的文本,合成了1000张图片用于训练,500张图片用于验证 -opt工具是PaddleLite-v2.12编译出来的
过程:使用修改后的配置文件以及合成的数据集,调用
python3 tools/train.py -c configsChange/rec/rec_chinese_lite_train_v2.0.yml -o Global.pretrained_model=./pretrain_models/ch_ppocr_mobile_v2.0_rec_pre/best_accuracy
开始训练,大约在150轮次左右acc达到0.9999,我就中断了训练,用输出的best_accuracy转推理转nb后,更换到androidDemo中,识别效果很差,基本都是错的
问题:
1.使用预训练模型进行微调,要求字典要新增字符,上面的数据集是否不够?不够的话多少比较合适?
2.数据集的内容是否只要带有新增字符的图片就可以了?其他常规字符是否也要有相应的图片?
3.训练acc基本保持在0.999时,我中断训练,使用best_accuracy的操作是允许的吗?
4.另外反馈一个问题,使用v3的训练模型,比如ch_PP-OCRv3_rec,不修改配置文件转成推理模型,然后用PaddleLite-v2.12编译出来的opt工具转成nb模型,会报错
Check failed: it != attrs().end(): No attributes called beta found for swish
即使是pip install paddlelite 安装v2.13rc0也有这个报错,这是为什么?