拉霸LaBa360

中文 English
一路昇腾 ,共赢行业智能化 ——2026 昇腾人为智能同伴峰会主题分享
2026.04.03

起源:鲲鹏昇腾开发者社区

2026 年 3 月 20 日 ,华为中国合作同伴大会 2026 期间 ,以 “与时期 ,共昇腾” 为主题的昇腾人为智能同伴峰会在丽江成功进行;獣N腾推算业务总裁张迪煊颁发《一路昇腾 ,共赢行业智能化》主题演讲 ,指出 AI 正从天生式 AI 迈向 Agentic AI ,2026 年将成为强化进建及 Agent 利用规模落地元年 ,昇腾将打造大、钟注幼三大主题算力场景 ,携手同伴共探行业智能化落地加快蹊径。

7fc366769d1941809bb6898d75a6ea38

华为昇腾推算业务总裁  张迪煊



一、开源盛开筑生态 ,昇腾与同伴携手共赢

2025 年是昇腾沉淀技术、拥抱开源的关键一年 ,同年 8 月昇腾正式颁发 CANN 和 Mind 系列软件全面开源盛开、架构解耦 ,并积极向业界贡献关键个性。其中 ,结合科大讯飞落地的大 EP 技术贡献至 vLLM 社区 ,添补了业界多机推理加快能力的空缺。
目前昇腾已向三方社区累计贡献超 11 万行代码 ,在毕昇编译器层构建 AscendNPU IR 滑润对接 Triton ,兼容 FSDP2、vLLM 等 50 多个主流开源社区和项目 ,实现开源模型 0day 支持 ,让开发者可急剧落地训练与推理创新。同时 ,多多 SOTA 开源模型基于昇腾原生孵化 ,如智谱基于昇腾仅三个月实现的多模态大模型 GLM-Image ,开源 24 幼时即登顶 Hugging Face Trending 榜第一。
在一体机产品领域 ,昇腾在 DeepSeek 颁布后急剧推出参考配置 ,使能 80 多家同伴 2 周内颁布自研产品。一年功夫里 ,已有 350 多家同伴打造 400 多款行业场景一体机 ,服务 2700 多家客户 ,占据国内一体机市场 80% 以上份额 ,加快大模型行业落地。

二、AI 迈入 Agentic 时期 ,2026 成强化进建 + Agent 利用落地元年

从前三年 AI 行业实现逾越式发展:2023 年 “大模型元年” 让模型从感知理解走向天生创造;2024 年 “大模型推理元年” 确立 Tokens 为 AI 时期新量纲;2025 年国产大模型开源发作 ,Tokens 使用量席卷千行万业。
当前 AI 正式迈入 Agentic AI 时期 ,实现从 “座谈天” 到 “能处事” 的升级。To C 端 ,OpenClaw 成为景象级开源利用 ,短功夫内收成超 32 万 star、百万新增用户 ,国内头部互联网纷纷布局智能体入口;To B 端 ,AI 深度渗入出产决策环节 ,强化进建成为基座模型落地行业主题场景的必选之路 ,而海量 Tokens 成为主题支持 ,其推算效能直接决定企业主题收益。

三、大中幼系列化算力盛开 ,适配全场景差距化需要

结合 AI 发展趋向与客户需要 ,昇腾打造三大主题算力场景 ,全方位满足行业差距化需要 ,助力同伴深耕行业智能化:
  1. 大算力场景:聚焦大模型预训练、强化进建后训练及大规模推理服务 ,昇腾将打造当先超节点架构及产品 ,盛开灵衢和谈、部件嘉拷寮架构 ,赋能企业沉塑主题业务;
  2. 中算力场景:覆盖辅助医疗、智慧讲授等主盛行业利用 ,萦绕 “开箱即用” 打造 “急剧部署 + 成本可控” 的平衡 ,盛开中心模组 / 刀片 ,支持同伴打造大模型利用一体机、高密服务器;
  3. 幼算力场景:聚焦工业质检、具身智能、科研讲授等智能边端领域 ,针对客户 “矫捷高效、成本可控” 的诉求 ,盛开尺度模组和板卡 ,使能同伴打造多样化边缘算力设备 ,挖掘海量市场潜力。

四、主题技术创新 ,打造全场景最佳解决规划

1. 超节点 + 大 EP ,破解大规模推理服务痛点

AI Agent 的遍及带来百倍级 Tokens 需要和 10ms 级时延要求 ,传统服务器堆叠模式存在内存独立编址、跨节点交互机能开销大的问题。昇腾 384 超节点实现 48TB 内存统一编址、全局内存共享 ,共享内存容量较传统方式提升 96 倍 ,NPU 间通过内存语义直接交互 ,数据交互效能提升 3 倍 ,可实现更高 KVCache ,满足 Agent 超长高低文需要 ,成为大规模推理的最优选择。
同时昇腾为同伴提供三条矫捷实现蹊径:复用 MindIE 成熟大 EP 规划急剧部署、合入 vLLM/SGLang 开源推理引擎降低迁徙成本、基于 CANN 深度定造极致机能推理引擎。目前硅基流动、清昴智能等同伴已基于该能力打造推理引擎 ,为金融行业提供服务 ,实现多轮工作应答速度提升 3 倍。

2. 异步流式数据引擎 TQ ,优化强化进建后训练

针对强化进建后训练场景 ,昇腾沉淀全流程最佳实际 ,提供一键部署的 Docker 镜像 ,解决业界普遍关注的训推资源调度难题。创新推出的 “异步流式数据引擎 TQ” 技术 ,实现节造流与数据流解耦 ,样本数据无需经节造器中转 ,依附超节点内存统一编址实现训推节点急剧数据交互 ,端到端机能提升 40% 以上 ,该个性已合入 verl 社区并利用于告白、信贷风控等主题场景。

3. 软硬件全面升级 ,开源 Agent 参考设计打造 “Claw 一体机”

面向国计民生大模型利用场景 ,昇腾产品分级分档升级:百亿级模型适配 A2 标卡 ,内存带宽达业界 1.8 倍 ,实现 100ms 推理时延;千亿级模型搭配单机服务器 ,算力达业界 2.3 倍;万亿级模型选取双机超节点服务器 ,为业界唯一可部署 T 级模型的产品 ,算力达业界 3.78 倍 ,突破 20ms 低时延。
同时昇腾推出 Agentic 开源参考设计 ,打包优化后的推理引擎、开源模型权沉及 OpenClaw 框架为齐全镜像 ,同伴只需聚焦业务集成与 Skill 开发 ,即可急剧打造 Agent 利用一体机;谒诘惴务器的一体机 ,可实现逐日 20 亿 Tokens 供给 ,目前已有 20 多家同伴落地有关产品 ,服务教育、医疗、金融等主题领域。

4. Atlas 350 加快卡 ,赋能推荐 / 多模态 / LLM 三大推理场景

昇腾颁布 Atlas 350 加快卡 ,搭载全新昇腾 950PR 处置器 ,机能较业界同类产品当先 1 至 1.4 倍 ,聚焦推荐、多模态、LLM 三大主题推理场景:算力内存双升级 ,单卡算力达业界 2.8 倍以上 ,支持 mxFP4 低精体式 ,片上内存最大 112GB ,多模态天活力能提升 60%;访存粒度降至 128 字节 ,海量幼算子访存效能提升 4 倍;支持 SIMT+SIMD 混合编程 ,开发更矫捷 ,满足同伴多样化需要。

五、深耕行业场景 ,技术与业务深度融合

2025 年 9 月 ,昇腾结合 20 多家 ISV 启动金融、能源等 5 大行业利用场景解决规划打造工作 ,半年内孵化出辅助办公、AI 实训、电子病历等十余个规划 ,落地 180 多家客户。其中在智慧文旅领域 ,结合海天瑞声、陕文投打造的多模态 AI 伴游副手 “幼七” ,已在陕西各大景点投放 ,为 400 多万游客提供个性化出游服务。
在智能边端领域 ,昇腾盛开多档位、高集成度的模组 / 板卡 ,结合多 OS 兼容、多场景 SDK ,使能同伴打造多样化产品。软通华方、同泰怡等同伴基于 Atlas 300I A2 打造的液冷 AI 工作站 ,具备静音、高密、省电蹬着势 ,成为科研仿真、医疗、金融等行业本地算力设备首选。

六、CANN 开源盛开升级 ,降低创新门槛

昇腾 CANN 开源盛开实现三大主题升级 ,进一步提升同伴开发与部署效能:
  1. 部署效能升级:将原有 8 个大包拆分为 29 个独立组件 ,包大幼从 2G 缩减至 0.43G ,个性加载功夫从 2 分钟缩短至 20 秒;
  2. 开发履历升级:实现主流算子编程框架无感对接 ,2026 年将开源 PyPTO 编程范式 ,使算子代码量均匀削减 70% ,可视化调试让复杂算子开发缩短至一周 ,同时提供开源 Skill 库支持算子自动天生 Agent;
  3. 社区资源升级:美满开源社区 CI/CD 流水线 ,2026 年 6 月将盛开 2000 卡免费算力资源 ,大幅降低开发者创新门槛。

七、五大创新方向 ,共筑可持续 AI 产业生态

昇腾萦绕硬件、算子、加快库、模型、利用五大创新方向 ,以社区化运作模式赋能同伴发展:美满激励机造与知识系统 ,盛开能力认证加快同伴能力转型;下发丰硕创新工作 ,设立 2000 万首批创新激励基金;深入昇腾万里同伴打算 ,升级 5000 万 NRE 激励同伴创新 ,创新成就将上架社区 AI 利用市场 ,实现结合推广、共享收益。

张迪煊暗示 ,昇腾与同伴已并肩走过 7 年 AI 发展之路 ,见证了行业从索求起步参与景落地的全过程。未来昇腾将持续以开源盛开为主题 ,与更多同伴携手打造可持续、有韧性的 AI 产业生态 ,共同推动行业智能化迈向新高度 ,共赢行业智能化时期新机缘。



版权申明:本文转载自鲲鹏昇腾开发者社区 ,仅用于行业资讯互换与技术分享 ,不代表本公司态度 ,不用于任何贸易用处。版权归原作者及原出处所有 ,如有侵权 ,请联下翻霸LaBa360实时删除

拉霸LaBa360(中国区)官方网站

拉霸LaBa360(中国区)官方网站
在线征询

4008-770-775

拉霸LaBa360(中国区)官方网站
电话征询
拉霸LaBa360(中国区)官方网站 TOP
【网站地图】