DeepSeek引领大模型新时代，昇腾大EP推理方案助力行业智能化

下载新华网客户端

2025-03-17 15:12:54

92.4万

随着人工智能技术的加速演进，大模型正沿着“技术摸高”与“工程创新”两条路径并行发展，为千行百业带来前所未有的智能化变革。DeepSeek作为近年来最受关注的开源大模型之一，彻底改写了AI算力需求的游戏规则，不仅凭借高效的工程优化在算力受限环境下实现卓越性能，还推动了大规模专家并行（Expert Parallelism, EP）技术的应用。与此同时，昇腾大EP推理方案的推出，进一步提升了大模型推理性能，为行业级应用带来了全新解决方案。

专家并行成趋势，大模型迈向普及

DeepSeek的创新路径表明，大模型不再仅仅依赖少量高性能计算专家（Large Experts），而是向大量小专家（Small Experts）方向演进。通过专家并行（EP）技术，模型可以将计算任务分配至更多的计算资源上，从而减少单卡显存占用，提高计算吞吐量，并有效降低推理时延。

这一变化极大降低了企业部署大模型的门槛，使得即便算力有限的机构，也能通过合理优化，在有限的硬件条件下运行高效的AI推理任务。DeepSeek的这种工程创新路径，不仅推动了大模型的普及，更让智能化真正落地到各行业。

此外，DeepSeek开创了全新的数据训练模式，结合基础模型生成的高质量合成数据与少量行业数据，即可训练出高性能行业模型，使企业不再受限于数据积累的不足。同时，DeepSeek的开源策略进一步降低了行业准入门槛，推动AI技术的广泛应用。

昇腾大EP推理方案：高性能低成本新选择

在大规模专家并行趋势下，昇腾大EP推理方案进一步提升了推理效率，实现了更高性能、更低时延以及更优性价比。

提升并发能力，降低成本：通过专家并行优化，昇腾方案显著降低单卡显存占用，并提升单卡并发能力至3倍，使企业能够在相同算力投入下获得更高推理吞吐量。

MoE负载均衡：通过自动寻优、自动预测、自动配比等技术，确保专家计算任务的均衡分布，优化推理效率。

PD分离部署，吞吐量提升50%+：创新的autoPD分离部署方案，可以自动感知负载变化，动态调整Prefill（预填充）与Decode（解码）实例的资源分配，使系统吞吐量提升50%以上。

通信优化与算子融合：采用双流/多维混合并行计算，以及MLAPO融合算子，将计算、通信和权重加载任务优化并行处理，减少计算开销，提高推理速度。

这些技术突破，使昇腾大EP推理方案能够在保证高效推理的同时，大幅降低企业部署成本，为大规模应用提供更稳定、更经济的AI推理基础设施。

产业智能化升级，AI普惠时代加速到来

DeepSeek的开源模式和优化技术已在金融、制造、教育、医疗等多个领域激发创新浪潮。同时，昇腾大EP推理方案的推出，使企业能够在高并发需求下，以更低的成本、更强的性能部署大模型应用。这些技术突破，不仅提升了行业智能化水平，也推动了大模型的进一步普及。

未来，专家并行（EP）等工程创新技术，将继续加速大模型在行业中的落地，让智能化真正走进千行百业，为产业升级提供更加高效、稳定的AI解决方案。

（责任编辑周亦张）

精彩推荐