Skip to content

DeepSparkHub 24.12 Release

Latest
Compare
Choose a tag to compare
@honglyua-il honglyua-il released this 23 Dec 06:23
· 81 commits to master since this release
a0b93a2

24.12 Release Notes

特性和增强

模型与算法

● 新增了4个PyTorch训练模型,其中2个为Multimodal模型
● 新增了5个大模型训练示例,涉及ColossalAI,Megatron-LM和LLaMA-Factory工具箱

PyTorch
KAN Mamba-YOLO LLaVA 1.5
Stable Diffusion 3
大模型
DeepSeek MoE 7B (ColossalAI) Llama3-8B SFT (ColossalAI) Mamba-2 (Megatron-LM)
Mixtral 8x7B (Megatron-LM) Qwen2.5-7B SFT (LLaMA-Factory)

● 更新了Llama2-7B (Megatron-DeepSpeed)模型的数据集链接。
● 同步了DBNet、Fast R-CNN和GoogLeNet等PyTorch模型的代码。
● 同步了BERT Base、FaceNet和ResNet50等TensorFlow模型的代码。
● 同步了ClossalAI、Megatron-DeepSpeed和OpenPCDet工具箱的代码。

版本关联

DeepSparkHub 24.12对应天数软件栈4.1.1版本。

贡献者

感谢以下社区贡献者

李一力,sanghui-ilu,majorli6,honglyua,吴永乐。

欢迎以任何形式为DeepSparkHub项目贡献。