配置:
RTX 3090,显存 24G
12核 CPU
内存:43G
运行 api.py。回答很慢,最后回答出的内容,还是空的。respone 空
在配置可以的情况下,速度快一些。内容能出来
- clone 项目并配置好一切;
- 运行 api.py
- 去进行模拟请求
- OS:Ubuntu 20.04
- Python: 3.8
- Transformers: 4.27.1
- PyTorch: 1.12
- CUDA Support (`python -c "import torch; print(torch.cuda.is_available())"`) : True