2025-03-20 22:43:08 来源:绿法国际联盟 作者:绿盟研究院
要点:当前,人工智能大模型技术发展迅猛,正推动各行各业智能化应用从概念走向实际落地。在这一过程中,大模型不仅追求性能的极致突破,更注重降低部署门槛,让更多企业和行业能够便捷、低成本地使用大模型技术,释放其巨大价值。
——援引自经济日报
DeepSeek通过发布高性能、低成本的开源模型,为人工智能产业发展提供了新路径,也带动全产业创新。日前,华为推出昇腾大规模专家并行推理方案,为大模型落地应用提供强大支撑。
业内专家分析,大模型技术正向两个方向并行发展,一种是少量大专家模式,即专注于追求极致的计算能力和精度,满足对性能要求极高的场景;另一种是大量小专家模式,即通过技术创新提升性能和部署难度,使大模型能快速普及到更多行业和场景中。这两种模式并非对立,而是相辅相成,共同推动大模型技术广泛应用。同时,大规模专家并行推理方案逐渐成为技术演进的重要趋势。这种模式通过将专家模型分布到更多计算卡上,减少了单卡的显存占用和权重加载时延,显著提升了计算效率,实现了更大的吞吐量和更低的时延。
据了解,在大规模专家并行的基础上,昇腾大规模专家并行推理方案通过专家并行优化,显著降低单卡显存占用,并提升单卡并发能力至3倍,使企业在相同算力投入下获得更高推理吞吐量;通过自动寻优、自动预测、自动配比等技术,确保专家计算任务的均衡分布,优化推理效率;可以自动感知负载变化,动态调整预填充与解码实例的资源分配,使系统吞吐量提升50%以上;采用双流/多维混合并行计算等技术,将计算、通信和权重加载任务优化并行处理,减少计算开销,提高推理速度。这些技术突破,使昇腾大规模专家并行推理方案在保证高效推理的同时,大幅降低企业部署成本,为DeepSeek等大模型大规模应用提供更稳定、更高效的AI推理基础设施。
场景应用是产业发展的主要驱动力。一方面,大模型开发门槛、应用成本不断降低,驱动产品创新、场景探索、行业赋能,DeepSeek的开源策略正加速人工智能应用多元化;另一方面,我国具有工业门类全、人口基数大、市场需求多等优势,为人工智能应用提供了丰富场景,不断催生新应用。
随着大模型技术不断成熟和成本降低,越来越多行业开始尝试将其应用于实际场景中。从金融、医疗到制造、教育,大模型正为各行各业带来智能化变革。可以预见,昇腾大规模专家并行推理方案等创新技术推出,将进一步降低大模型的部署门槛,让大模型在更多场景中发挥重要作用,推动行业智能化向更深层次发展。
来源:经济日报