规划类政策解读  政策解读
规划类行业新闻  行业新闻
规划成果  规划成果
产业调研成果 产业调研成果
招商策划成果 招商策划成果
概念规划成果 概念规划成果
地产策划成果 地产策划成果
投融资顾问成果 投融资顾问成果
园区规划成果 园区规划成果
产业规划成果 产业规划成果
企业战略成果 企业战略成果
首页 > 走进中机院 > 中机院观点 > 中机院观点

国产大模型驱动新质生产力发展的实践基础

来源:原创  时间:2025-08-22  点击:240
DeepSeek通过“算力弹性化—算法稀疏化—数据价值化”的协同推进,突破了传统大模型的“算力堆砌”困境,为大模型技术持续进化提供了可扩展的技术框架。

当前,全球人工智能技术加速迭代,已成为推动新一轮科技革命和产业变革的核心力量,为新质生产力的发展注入了前所未有的时代动能。我国顺应这一趋势,逐步构建起涵盖基础层、框架层、模型层与应用层的完整人工智能产业体系,为新质生产力的现实转化提供了坚实支撑。特别是以Deep⁃Seek为代表的国产大模型持续突破核心技术瓶颈,在跨模态理解、知识生成与自主推理等方面展现出显著优势,不仅有效提升了智能化生产效率,而且加速了智能技术与实体经济的深度融合,成为驱动新质生产力发展的关键创新支撑。

(一)全球人工智能发展方兴未艾为新质生产力发展提供时代机遇

人工智能作为新一轮科技革命和产业变革的主导性技术,不仅实现了生产力的指数级跃迁,而且深刻地渗透到社会生产生活的各个方面,给世界政治、经济、文化各方面带来了深远的影响。鉴于此,世界主要经济体争相制定并实施人工智能发展战略,积极推动人工智能技术的研究与应用。

从全球主要经济体人工智能领域的发展态势来看,已初步形成美、中、欧盟三足鼎立的格局,各经济体在政策规划、研发投入、专利产出和产业应用等层面各具特色。其一,政策规划层面,通过顶层设计强化人工智能发展的战略框架。美国是最早意识到人工智能战略价值的国家,依托其雄厚的科研基础和活跃的科技企业生态,在人工智能领域始终保持着全球领先地位。欧盟在发展人工智能领域方面独树一帜,其策略着重于在科技创新与社会责任之间寻求平衡。其中2024年5月《人工智能法案》的正式生效,标志着欧盟人工智能领域监管立法与实践走在世界前列。中国人工智能产业在国家战略规划的推动下形成“政策引导、场景驱动、产业协同”的发展格局,成为全球人工智能发展最具活力和潜力的国家之一。其二,研发投入层面,持续在人工智能领域实施重大投资布局。美国斯坦福大学2025年4月发布的《2025年人工智能指数报告》显示,2024年,在人工智能私人投资方面,美国以1091亿美元遥遥领先,是排名第二的中国(93亿美元)的11.7 倍[32]。在生成式人工智能投资方面,美国的投资超过了中国、欧盟,差距进一步扩大。在知识创新方面,2023年,中国发表的关于人工智能的论文(23.2%)和被引用次数(22.6%)均超过其他国家,但美国在具有高影响力的研究方面领先(被引次数最多的前100名)。另外,美国仍是知名大模型的核心策源地,2024 年美国产生了40个知名大模型,远超中国和欧盟。尽管美国在数量上保持领先,但中美之间顶尖模型的性能差异从2023年的4.9%缩减至2024年的0.7%[32],这表明中国大模型的质量在迅速崛起。其三,专利产出层面,呈现出中美主导、多国竞逐,技术集中度高且应用导向明显的发展态势。截至2023 年年底,中国在总人工智能专利数量上领先,占所有专利授予的69.7%,是排名第二美国(14.2%)的4.9倍。其四,产业应用层面,人工智能不再停留在实验阶段,落地转化呈现出前所未有的活跃态势。麦肯锡调查报告显示,2024年有78%的受访者表示,其所在组织在至少一个业务环节中使用人工智能,这一比例相较2023年的55%显著提升;同时,生成式人工智能的使用率也由2023年的33%增长至71%。由此可见,人工智能正逐步从企业应用中的辅助工具转变为推动核心业务发展的关键力量。

(二)我国人工智能产业体系为新质生产力发展提供现实条件

尽管我国人工智能发展起步较晚,但在国家战略规划和产业政策的推动下,人工智能发展“已进入技术攻坚、应用深化、生态重构的新阶段,在全球人工智能大模型发展中处于第一梯队”,形成了涵盖基础层、框架层、模型层和应用层的完整人工智能产业体系,为新质生产力的发展提供了强劲引擎与广阔空间。

人工智能产业各层级之间相互嵌套、协同推进,形成从技术供给到场景落地的闭环体系。其一,基础层是人工智能产业发展的底层支撑,包括算力、算法和数据三大核心要素。算力方面,截至2024年底,我国在用算力中心机架总规模超过900万标准机架,算力总规模达280EFLops(每秒百亿亿次浮点运算),国家八大枢纽节点算力总规模达175EFLops;智能算力规模达90 EFLops,在总算力规模中占比提升至32%,为海量数据计算提供了智能底座。算法方面,基于Transformer架构不断进行优化与创新,诸如多头潜在注意力机制和混合专家系统等结构性创新显著提升了算法在大模型训练与推理阶段的效率与表现力。数据方面,通过构建多源异构、结构化与非结构化并重的行业知识图谱与高质量训练语料库,为大模型预训练与垂类模型精调提供了丰富的“养料”保障。其二,框架层是连接基础层与上层应用的技术桥梁,主要包括深度学习框架、开发工具链及开源社区。深度学习框架方面,我国已构建起以飞浆(PaddlePaddle)、昇思(MindSpore)、一流科技(OneFlow)等为代表的自主框架体系,初步具备与机器学习框架(TensorFlow)、深度学习工具(PyTorch)等国际主流框架竞争的能力。开发工具链方面,一是围绕国产芯片,如昇腾(Ascend)、昆仑(Baidu)构建的异构兼容编译工具与算子优化系统,实现了从硬件到算法的深度融合,显著提升了大模型在本土算力平台上的运行效率;二是以飞桨、昇思为核心的开发工具链体系,在模型压缩、自动并行训练、跨端部署、可解释性分析等环节形成了差异化优势。开源社区方面,通过构建活跃的社区生态,聚集了大量开发者与开源项目,推动了开源技术的本土化演进与产业化落地。其三,模型层聚焦大模型及垂直领域模型的研发与优化,是技术落地的关键环节。深度求索、百度、腾讯、阿里巴巴、字节跳动、商汤科技等企业凭借各自的发展战略和技术特色,“纷纷投身大模型研发赛道,不断探索创新的模型架构、训练算法与优化策略,呈现‘百模竞争’的火热局面”。其四,应用层不仅是技术价值的最终体现,更是驱动新质生产力加快形成的实践前沿。一方面,依托大模型与行业知识融合能力,在智能制造、智慧医疗、金融风控、教育辅助、数字政务等领域持续涌现出一批具备场景适配性与规模化部署能力的AI应用解决方案。另一方面,不断推动算法能力与实体经济深度融合,催生了智能客服、虚拟人、智能驾驶、工业质检等新业态、新模式。

(三)DeepSeek大模型技术优势为新质生产力发展提供创新支撑

DeepSeek之所以能够在短时间内实现对国际顶尖大模型的赶超,并非源自技术代际超越,而是现有算力、算法与数据三大核心维度实现了协同推进、极致优化的系统性创新,构建了具有高性能、高效率和高适应性的机器学习模型。

算力维度体现为自主可控的算力生态与技术链的系统整合。其一,实现动态异构资源的高效映射。DeepSeek 采用动态资源调度策略,能够在CPU、GPU、AI加速芯片等多种异构算力资源之间实现高效映射。其底层调度系统可根据模型训练阶段的不同计算需求,动态分配资源,从而提升整体算力利用率与能源效率。其二,国产化高性能芯片适配。DeepSeek在算力部署过程中,积极适配国产AI 芯片,如昇腾(Ascend)、寒武纪(Cambricon)等,并针对其架构特性优化深度学习框架与编译器,加快了自主可控AI基础设施的落地,提升了系统的安全性与可持续性。其三,引入FP8混合精度训练框架。DeepSeek-V3使用FP8(8位浮点数)全栈技术,提升算力运行效率,并显著降低对存储的消耗,实现了“高性能—低能耗”的平衡。

算法维度体现为以稀疏激活机制为核心的算法效率优化路径。其一,混合专家模型架构的优化。该架构主要通过细粒度专家、共享专家和路由机制实现了模型容量的高效扩展,在保持模型整体容量(总参数671B)的同时,大幅降低了计算负载(每步仅激活参数37B),实现了“规模—效率”兼容。其二,多头潜在注意力机制的创新。DeepSeek的多头潜在注意力机制创新地采用低秩联合压缩技术,显著减少了推理时的键值缓存和训练时的激活内存,同时保持了与标准多头注意力机制相当的性能。其三,知识蒸馏技术的应用。DeepSeek的蒸馏技术将数据蒸馏与模型蒸馏相结合,通过监督微调的方式,将教师模型的知识迁移到学生模型中,实现了从大型复杂模型到小型高效模型的知识迁移。

数据维度体现为本土语义建模与知识体系的融合并进。其一,多令牌预测(MTP)技术的应用。多令牌预测是语言建模中的一种先进方法,其工作原理是通过模型一次预测多个token,以提升模型的训练效率、生成质量和推理速度。DeepSeek团队率先将MTP技术应用于大模型训练中,通过动态分配计算资源,利用MTP模块约束模型的高效优势,在保持模型性能的同时显著提升训练和推理效率。其二,本土知识结构深度嵌入。DeepSeek在语料构建过程中系统引入中国本土知识体系,包括传统文化经典、政策法规文书、国家发展战略文本、产业发展资料与社会治理文献等内容。这种知识嵌入不仅增强了模型对特定领域语言的理解深度,也提升了其在面对中文场景时复杂语义推理与内容生成的能力。

总体来看,DeepSeek通过“算力弹性化—算法稀疏化—数据价值化”的协同推进,突破了传统大模型的“算力堆砌”困境,为大模型技术持续进化提供了可扩展的技术框架。(作者:刘伟)

上一篇:国产大模型驱动新质生产力发展的政策路径
下一篇:专项债如何提质园区产业发展规划
规划首页 | 业务领域 | 规划收费标准 | 资源优势及资质 | 咨询业绩 | 官网地图
Copyright 2000-2020 中机产城规划设计研究院 版权所有 北元律师事务所提供法律支持
地址:北京市丰台区总部基地汉威国际广场4区3号楼5层
全国免费咨询热线:400-666-8495
传真:010-51667252-666
备案号:京ICP备08008382号-3
扫一扫关注
中机院
园区规划
产业规划
中机院微信