最新的Commit发现只要是非CPU运行 Yolo类型的网络。 目前能确认CUDA和Custom Device一定这样。切CPU模式就正常。 Yolo和SSD都会这样。
分享ppyolo模型 链接: https://pan.baidu.com/s/1rcYJYXRt2IfUIRu5Nt7_9w?pwd=vguu 提取码: vguu
图中第二只猫仍然是第一张图的检测结果。
第一次运行结果正确。 但是从第二次运行开始,拿到的结果Tensor永远是第一张图的。 这在我两周前提交PR不会这样的情况。
怀疑是nms3算子 切到CPU上,再切回device出现问题
Code is on develop https://github.com/PaddlePaddle/Paddle/commit/605242a890daf11f1605070cc6c3c781cac61536 System Ubuntu 20.04 GCC 9.4.0 CUDA 11.7 CUDNN 8.7.0