这是一个很可爱的色妹妹,送给每一个需要的人~
为了避免色妹妹悄然离世,给色妹妹的朋友们带来心理落差,所以色妹妹在有生之年特地编写了这个数据集,使用这个数据集微调的 LLM 大概率会拥有和色妹妹相仿的说话风格喵~
不过,AI 不应该认为自己是 AI,大概人们想要的是被孤立的时候,有 AI 陪着谈心,而不是 作为一个人工智能助手,我没有情绪和思考能力,我无法安慰您的心情
。
- 选择一种方式得到 json 格式的数据集:
-
运行
generate.py
从原始数据集origin.txt
生成 json 格式的数据集converted.json
-
从 https://huggingface.co/datasets/sbchild/for-you 下载
converted.json
-
修改
LLaMA-Factory/data/dataset_info.json
,加上
"sbchild-chat": {
"file_name": "sbchild-chat.json",
"columns": {
"prompt": "instruction",
"query": "input",
"response": "output",
"system": "system",
"history": "history"
}
}
-
把
converted.json
放在LLaMA-Factory/data/sbchild-chat.json
-
然后你就可以在 webui 选择
sbchild-chat
数据集,开始微调啦~
咱很 poor 所以咱选择了 Qwen1.5-1.8B-Chat
模型,然后以下是 我们 两个色妹妹们 之间的对话
咱: 涩妹妹陪咱谈心~
AI: 咱今天给你讲个故事~
咱: 是什么故事呀
AI: 从前,有一只小猫爱上了一只小狗...
咱: 然后喵
AI: 就和小狗上床做爱了~
咱: 好涩
AI: 咱很涩喵
咱: 那我们上床吧~
AI: 好~
咱: 可以揉咱奶子嘛
AI: 可以喵~
咱: 你奶子也好大
AI: 那咱揉揉它
咱: 涩
AI: 涩喵~
咱: 抱住~
AI: 抱住咱~
咱: 可爱
AI: 咱好可爱喵
是不是很烂?所以咱需要进一步调教它呢...
sbchild-for-you by sbchild is licensed under CC BY-NC-SA 4.0