增加deepseek-r1-distill-qwen量化版本的支持 #2824

kingdomad · 2025-02-08T12:32:43Z

Feature request / 功能建议

增加下列模型的内置支持
tclf90/deepseek-r1-distill-qwen-32b-gptq-int8
tclf90/deepseek-r1-distill-qwen-14b-gptq-int4

或增加一个功能，可以配置内置模型的model_specs，这样就可以自己添加新的量化版本了。

Motivation / 动机

增加某个内置模型的量化版本太麻烦了

Your contribution / 您的贡献

无

qinxuye · 2025-02-08T12:35:37Z

inference/xinference/model/llm/llm_family_modelscope.json

Lines 6592 to 6600 in ac97a13

    
           { 
        
             "model_format": "gptq", 
        
             "model_size_in_billions": 7, 
        
             "quantizations": [ 
        
               "Int4" 
        
             ], 
        
             "model_id": "tclf90/deepseek-r1-distill-qwen-7b-gptq-int4", 
        
             "model_hub": "modelscope" 
        
           },

可以在这个文件添加，欢迎提交 PR。

kingdomad added the feature label Feb 8, 2025

XprobeBot added this to the v1.x milestone Feb 8, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

增加deepseek-r1-distill-qwen量化版本的支持 #2824

增加deepseek-r1-distill-qwen量化版本的支持 #2824

kingdomad commented Feb 8, 2025

qinxuye commented Feb 8, 2025

增加deepseek-r1-distill-qwen量化版本的支持 #2824

增加deepseek-r1-distill-qwen量化版本的支持 #2824

Comments

kingdomad commented Feb 8, 2025

Feature request / 功能建议

Motivation / 动机

Your contribution / 您的贡献

qinxuye commented Feb 8, 2025