24.12 Release Notes
特性和增强
模型与算法
● 新增了4个PyTorch训练模型,其中2个为Multimodal模型
● 新增了5个大模型训练示例,涉及ColossalAI,Megatron-LM和LLaMA-Factory工具箱
PyTorch | ||||
---|---|---|---|---|
KAN | Mamba-YOLO | LLaVA 1.5 | ||
Stable Diffusion 3 | ||||
大模型 | ||||
DeepSeek MoE 7B (ColossalAI) | Llama3-8B SFT (ColossalAI) | Mamba-2 (Megatron-LM) | ||
Mixtral 8x7B (Megatron-LM) | Qwen2.5-7B SFT (LLaMA-Factory) |
● 更新了Llama2-7B (Megatron-DeepSpeed)模型的数据集链接。
● 同步了DBNet、Fast R-CNN和GoogLeNet等PyTorch模型的代码。
● 同步了BERT Base、FaceNet和ResNet50等TensorFlow模型的代码。
● 同步了ClossalAI、Megatron-DeepSpeed和OpenPCDet工具箱的代码。
版本关联
DeepSparkHub 24.12对应天数软件栈4.1.1版本。
贡献者
感谢以下社区贡献者
李一力,sanghui-ilu,majorli6,honglyua,吴永乐。
欢迎以任何形式为DeepSparkHub项目贡献。