模型加载是不是太慢了 #23

MagiciSource · 2023-05-11T04:31:25Z

相比于FastAsr，模型加载时间长10多倍，有什么方法可以加速么

SWHL · 2023-05-11T05:34:00Z

这个可以参考这里：ONNX runtime takes much time and memory to load model #3802
加载慢，还是比较能接受的

MagiciSource · 2023-05-12T01:58:00Z

这个可以参考这里：ONNX runtime takes much time and memory to load model #3802 加载慢，还是比较能接受的

我尝试了下，加载优化过的模型可以减少一点加载时间，还有设置ORT_PARALLEL可以减少差不多一半的加载时间，但是好像会让推理时间长一点点。另外有没有什么方式可以减小模型的大小？

SWHL · 2023-05-12T02:06:48Z

模型大小，可以尝试用onnxruntime中自带的量化方法
参考经验：之前测过，量化之后，推理速度变慢了

Provide feedback