请问目前开源的72B和灵积上的72B是同一个模型吗？ #1026

blurrrryface · 2024-01-30T01:50:01Z

blurrrryface
Jan 30, 2024

之前在测试的过程中一直用的是灵积的API，但是最近服务器到了后本地部署了72B后发现输出的结果有点差距，在输入文本较短的时候还是表现挺不错的，但是长文本，例如RAG这种，推理的结果相比API的就偏短很多了

crisqqq · 2024-02-04T13:43:11Z

crisqqq
Feb 4, 2024

也许不是同一个模型。通过灵积API调用的模型可以与langchain结合实现RAG等功能，但是本地部署的模型不可以按照langchain文档上的示例去用。例如：
chain = (
{"question": RunnablePassthrough()}
| prompt
| model
| StrOutputParser()
)

# 调用处理链获取问题的回答
result = chain.invoke({"question": query})

这段代码如果model=Tongyi()就可以正常运行，如果将model换成本地部署的模型就会报错。（model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-1_8B-Chat", device_map="cpu", trust_remote_code=True).eval()这样就报错）

目前不知道如何解决。

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问目前开源的72B和灵积上的72B是同一个模型吗？ #1026

{{title}}

Replies: 1 comment

{{title}}

Select a reply

请问目前开源的72B和灵积上的72B是同一个模型吗？ #1026

blurrrryface Jan 30, 2024

Replies: 1 comment

crisqqq Feb 4, 2024

blurrrryface
Jan 30, 2024

crisqqq
Feb 4, 2024