Q
[PaddlePaddle/PaddleOCR]paddleOCR运行印章比对模型报错
5
采用paddleOCR运行印章比对模型时报错
- 系统环境/System Environment:win64
- 版本号/Version:
Paddle:2.5.1
PaddleOCR:2.7.3
问题相关组件/Related components:tool/infer_e2e.py
- 运行指令/Command Code:python tools/infer_e2e.py -c configs/pgnet_r50_vd_seal/config.yml -o Global.pretrained_model=./pgnet_r50_vd_seal/best_accuracy Global.infer_img=../data_test/raw/image2.png
- 完整报错/Complete Error Message:
A
回答
7
加了这个就可以输出了,但是不知道会不会影响其他的应用
1
但是这个识别效果有问题,是不是不能直接改为32位,希望解答一下
0
同时会提示模型参数无法无法匹配
2
0
可以提供一下config文件的信息吗
Global:
use_gpu: false
epoch_num: 600
log_smooth_window: 20
print_batch_step: 10
save_model_dir: ./output/pgnet_r50_vd_seal_run/
save_epoch_step: 300
eval_batch_step:
- 0
- 400
cal_metric_during_train: false
pretrained_model: ./pretrain_models/train_step1/best_accuracy
checkpoints: null
save_inference_dir: null
use_visualdl: false
infer_img: null
valid_set: totaltext
save_res_path: ./output/pgnet_r50_vd_totaltext/predicts_pgnet.txt
character_dict_path: ppocr/utils/ppocr_keys_v1.txt
character_type: EN
max_text_length: 50
max_text_nums: 10
tcl_len: 64
load_static_weights: false
Architecture:
model_type: e2e
algorithm: PGNet
Transform: null
Backbone:
name: ResNet
layers: 50
Neck:
name: PGFPN
Head:
name: PGHead
Loss:
name: PGLoss
tcl_bs: 32
max_text_length: 50
max_text_nums: 10
pad_num: 6623
Optimizer:
name: Adam
beta1: 0.9
beta2: 0.999
lr:
name: Cosine
learning_rate: 0.001
warmup_epoch: 50
regularizer:
name: L2
factor: 5.0e-05
PostProcess:
name: PGPostProcess
score_thresh: 0.5
mode: fast
Metric:
name: E2EMetric
mode: A
gt_mat_dir: ./train_data/total_text/gt
character_dict_path: ppocr/utils/ppocr_keys_v1.txt
main_indicator: f_score_e2e
Train:
dataset:
name: PGDataSet
data_dir: ./train_data/
label_file_list:
- ./train_data/label_2_rotate_transform_final.txt
- ./train_data/label_3_rotate_transform_final.txt
ratio_list:
- 1.0
- 1.0
transforms:
- DecodeImage:
img_mode: BGR
channel_first: false
- E2ELabelEncodeTrain: null
- PGProcessTrain:
batch_size: 5
min_crop_size: 24
min_text_size: 4
max_text_size: 512
- KeepKeys:
keep_keys:
- images
- tcl_maps
- tcl_label_maps
- border_maps
- direction_maps
- training_masks
- label_list
- pos_list
- pos_mask
loader:
shuffle: true
drop_last: true
batch_size_per_card: 5
num_workers: 16
Eval:
dataset:
name: PGDataSet
data_dir: ./train_data/
label_file_list:
- ./train_data/label_test.txt
transforms:
- DecodeImage:
img_mode: BGR
channel_first: false
- E2ELabelEncodeTest:
character_dict_path: ppocr/utils/ppocr_keys_v1.txt
- DetResizeForTest:
image_shape:
- ToCHWImage: null
- KeepKeys:
keep_keys:
- image
- shape
- polys
- texts
- ignore_tags
- img_id
loader:
shuffle: false
drop_last: false
batch_size_per_card: 1
num_workers: 2
profiler_options: null
6
可以提供一下config文件的信息吗
有哪些地方需要调整吗
9
目前看来,有点像head网络初始化有问题,因为我看字典使用的是ppocr_keys_v1.txt,它里面共有6623个字符,你可以往这方面考虑一下
4
目前看来,有点像head网络初始化有问题,因为我看字典使用的是ppocr_keys_v1.txt,它里面共有6623个字符,你可以往这方面考虑一下
我是直接下载整个模型文件下来的,里面有相关的模型和配置文件,但是没有相关字典,这种怎么处理呢
6
目前看来,有点像head网络初始化有问题,因为我看字典使用的是ppocr_keys_v1.txt,它里面共有6623个字符,你可以往这方面考虑一下
3
可以直接用训练权重里提供的config.yml 文件试下
1
可以直接用训练权重里提供的config.yml 文件试下
是这个吗
4
这个:
6
这个:
刚刚用的就是这个,上面提供的config信息即是这个文件
3
这个:
或者你们那有最新的吗,可以私发我一下,我换上去试试
1
这个:
也可以看看目前这个文件和你们现在最新文件的差异
6
可以直接用训练权重里提供的config.yml 文件试下
后续怎么处理呢
6
9
这边会记录一下,尝试复现问题
图中是两份config在推理环节可能比较重要的差异,可以看一下
如果有进展的话可以跟我说一下,需要远程控制的话,我这边可以协助复现,因为这个跟我们后续的一个排期计划比较相关,有劳了,感谢!
8
训练和推理使用了不同的配置吗? 看到字典不同应该是导致参数无法加载最主要的问题。 如果使用了ic15_dict.txt 训练,请同样使用这个ic15_dict.txt推理。
另外:训练和推理的配置文件应保持一致
0
训练和推理使用了不同的配置吗? 看到字典不同应该是导致参数无法加载最主要的问题。 如果使用了ic15_dict.txt 训练,请同样使用这个ic15_dict.txt推理。 另外:训练和推理的配置文件应保持一致
我没有进行训练,图中左侧的是打码拉下来后e2e的默认配置文件,图中右侧才是印章模型配套的config,目前这个config中的训练和推理用的txt是一致的。目前是打算直接使用模型和配套的config,现象是使用下载下来的模型和配置文件会有报错。
7
目前看来,有点像head网络初始化有问题,因为我看字典使用的是ppocr_keys_v1.txt,它里面共有6623个字符,你可以往这方面考虑一下
可以提供一下这个模型和config的下载地址,我这边尝试复现一下
1