DeepSeek系列AI模型在昇腾平台的高效部署与实践
DeepSeek AI近期发布的Janus-Pro多模态大模型以及此前发布的DeepSeek-R1、DeepSeek-V3和DeepSeek-V2大型语言模型,在人工智能领域引发广泛关注。这些模型在性能和效率方面均有显著提升,并率先支持昇腾平台。神州数码旗下神州鲲泰推理服务器搭载昇腾硬件,可快速部署DeepSeek系列模型,为用户提供高效便捷的AI开发和应用体验。
2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2和Janus-Pro正式上线昇腾社区,开发者可一键获取模型并在昇腾硬件平台上快速部署和进行推理。
本文以DeepSeek-V3为例,详细介绍了在昇腾社区高效获取和使用模型的方法。
硬件需求: 部署DeepSeek-V3模型需要4台KunTai A924推理服务器(每台配备8张昇腾推理卡)。
模型调用步骤:
- 权重转换: 需要将模型权重从GPU版本转换为NPU版本。
- 加载镜像: 从昇腾社区下载适配DeepSeek-V3的镜像包(例如:mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64),并使用docker images命令确认镜像。
- 容器启动: MindIE镜像预置了DeepSeek-V3模型推理脚本。获取权重文件后,放置在模型代码主目录下,修改文件权限,然后启动容器。
- 服务化测试: 配置服务化环境变量,例如启用内存池扩展段功能,修改服务化参数,启动服务。启动成功后,将显示“Daemon start success!”。
更多关于DeepSeek系列模型在昇腾平台的使用方法和指导文档,请访问昇腾社区模型库专区。
相关文章
- 详细阅读
- 详细阅读
-
苹果AI蒸馏研究:高效小模型训练的突破与挑战详细阅读
苹果公司近期在人工智能领域的突破性研究,为模型蒸馏技术带来了新的理解,并为高效训练小模型提供了新的思路。这项研究深入分析了蒸馏技术的缩放规律(Scal...
2025-02-23 3
- 详细阅读
-
阿里云DataWorks集成DeepSeek大模型:对大数据开发治理的深远影响详细阅读
阿里云DataWorks平台正式接入DeepSeek的两款大模型DeepSeek-R1(671B 和DeepSeek-R1-Distill-Qwen-...
2025-02-23 5
- 详细阅读
- 详细阅读
- 详细阅读
发表评论