华为云:第一时间完成DeepSeek-V3.2-Exp模型适配工作

观点网讯:9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,模型引入稀疏Attention架构。

华为云第一时间完成对DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。

目前,该模型已正式上架华为云大模型即服务平台MaaS,为企业及开发者提供模型体验和API服务。

华为云ModelArts推理平台基于CloudMatrix384超节点,为DeepSeek-V3.2-Exp模型提供稳定、高可靠的推理服务。ModelArts推理平台能够根据实际负载需求,按需供给和分配模型推理算力资源,实现资源分时复用与灵活扩缩容。针对DeepSeek-V3.2-Exp模型,此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

责任编辑:山上
AI智能分析该文,为您挖掘投资机会该AI功能处于试用阶段,内容仅供参考,请仔细甄别!
展开
精彩推荐
加载更多
全部评论
热榜
关闭 下载金融界app
金融界App
金融界微博
金融界公众号