Release DeepSparkHub 24.12 Release · Deep-Spark/DeepSparkHub

24.12 Release Notes

特性和增强

模型与算法

● 新增了4个PyTorch训练模型，其中2个为Multimodal模型
● 新增了5个大模型训练示例，涉及ColossalAI，Megatron-LM和LLaMA-Factory工具箱

PyTorch
KAN	Mamba-YOLO	LLaVA 1.5
Stable Diffusion 3
大模型
DeepSeek MoE 7B (ColossalAI)	Llama3-8B SFT (ColossalAI)	Mamba-2 (Megatron-LM)
Mixtral 8x7B (Megatron-LM)	Qwen2.5-7B SFT (LLaMA-Factory)

● 更新了Llama2-7B (Megatron-DeepSpeed)模型的数据集链接。
● 同步了DBNet、Fast R-CNN和GoogLeNet等PyTorch模型的代码。
● 同步了BERT Base、FaceNet和ResNet50等TensorFlow模型的代码。
● 同步了ClossalAI、Megatron-DeepSpeed和OpenPCDet工具箱的代码。

版本关联

DeepSparkHub 24.12对应天数软件栈4.1.1版本。

贡献者

感谢以下社区贡献者

李一力，sanghui-ilu，majorli6，honglyua，吴永乐。

欢迎以任何形式为DeepSparkHub项目贡献。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

DeepSparkHub 24.12 Release

24.12 Release Notes

特性和增强

模型与算法

版本关联

贡献者