[2noise/ChatTTS]gpt.pt如何导出onnx?

其他模型导出很容易，就这个不会，希望能新增onnx导出

Baiyuetribe

同求方案

ZaymeShaw

可以分块导出，分成每个decoder layer、LM head、Embedding、sample head导出。

ZillaRU

https://github.com/2noise/ChatTTS/pull/622 之前写的导出脚本。 https://zhuanlan.zhihu.com/p/703240560

ZillaRU

@ZillaRU 哇，gpt竟然能分割导出10个以上的onnx文件，有点小困惑。真的不能再柔和一下吗？

Baiyuetribe

@ZillaRU 感谢分享思路。想问下是因为需要对应cpp里面的算子实现，所以才需要拆的这么细吗。如果只是往tensorRT方向加速的话，是不是可以适当做一些融合

ZaymeShaw

可以参考https://github.com/tpoisonooo/llama.onnx 做导出，chatTTS的gpt其实是一个小型的llama。拆的细是因为每个decoder layer的结构是等同的，单独拆开方便对单个block的优化和测试验证。可以认为优化了单个就是优化了全部。而且做量化的话这样好观察误差来源。

ZillaRU

[2noise/ChatTTS]gpt.pt如何导出onnx?

回答