华为昇腾全面开源开放，释放了哪些信号？

Wait 5 sec.

商业世界里所有生态的博弈，从来不止是技术的竞速，更是开放性的较量。当技术的壁垒被打破，当协作的门槛被降低，创新的洪流就会奔涌而出。如今，在如火如荼的AI计算产业，一场开源实践也正在悄然酝酿。在华为全联接大会2025期间，华为宣布昇腾将分层解耦、全面开源开放，支持Triton、PyTorch、vLLM、verl等主流社区，并成立CANN（Compute Architecture for Neural Networks，由华为推出的神经网络异构计算架构）技术指导委员会，推动生态走向社区化治理。与此同时，华为还推出了创新的超节点架构，发布标卡、模组、服务器、集群等多款最新的超节点产品，覆盖小型工作站、企业级数据中心、大型数据中心等多个场景。华为董事、ICT BG CEO杨超斌表示，将坚持硬件开放、软件开源，支持伙伴打造面向行业的超节点场景化解决方案。不难看出，华为的所有动作都离不开一个关键词：开放。对渴望打破算力垄断的全球AI计算产业而言，开放究竟意味着什么？打破封闭的藩篱读懂昇腾的开放策略，首先要理解何为CANN。CANN的全称是“神经网络异构计算架构”（Compute Architecture for Neural Networks）。通俗地说，它是把上层AI训练框架（如PyTorch、TensorFlow、MindSpore等）和底层昇腾芯片连接起来的桥梁，作用在于最大化地释放GPU的潜力。当前，业内最知名的异构计算架构莫过于英伟达的CUDA。作为英伟达的核心技术平台，CUDA不仅推动了 GPU 从图形处理单元向通用计算平台的转变，还构建了一个庞大且高质量的开发者生态系统。如今整个AI开发生态大多构建在 CUDA 的基础之上，这也使得英伟达在AI大潮中占据了不可替代的位置。在相当长的一段时间里，CUDA都难寻对手，原因正是这个强大的软硬件协同生态系统，开发者可以借此在GPU上实现高效的并行计算。但这个系统存在一个短板：封闭。开发者一旦进入CUDA生态就很难再脱离，因为要转向其他GPU框架，意味着重写代码、重学新工具，存在巨大的转换成本。英伟达创始人黄仁勋曾明确表示，绝不会将CUDA开源。对英伟达而言，这是维护其技术垄断地位的一种策略，但也无形中限制了开发者的选择。挑战封闭的最佳手段，就是开放。早在2018年，华为就提出了「全栈全场景AI解决方案」，旨在形成从芯片（昇腾）、芯片使能（CANN）到AI框架（MindSpore）及应用的一套完整AI基础设施。其中，CANN是昇腾AI计算产业的核心基础软件，也是其挑战行业垄断的战略支点。一个重要的里程碑是，2025年8月，华为轮值董事长徐直军宣布CANN全面开源开放。这是华为向外界释放的一个重要信号——华为决心打破AI算力领域的封闭格局，将底层技术的选择权交还给开发者，也为世界提供CUDA之外的新选择。从开源鸿蒙、鲲鹏、欧拉到CANN，华为早已将开源开放刻入自身的技术基因。作为全球20多个开源基金会的创始成员或顶级成员，华为已累计在300多个上游社区成为核心代码贡献者。背后的根本逻辑是，在基础软件和根技术领域，生态的繁荣远比单一的硬件性能更重要。只有打破封闭的藩篱，形成创新合力，才能构建起坚固的数字根基。软件开源，硬件开放要开辟一个全新的生态，华为的诚意是什么？按照华为公司副总裁、昇腾计算业务总裁张迪煊的说法，昇腾将分层解耦、全面开源开放，并全面支持Triton、PyTorch、vLLM、verl等主流社区。这可以视为，华为向全球AI开发者敞开了底层算力架构的大门。传统AI开发中，硬件底层往往是一个「黑盒」，就像是驾驶一辆引擎盖被焊死的汽车，能踩油门、转方向盘，但对引擎内部一无所知。这就是开发者面对传统AI硬件的桎梏：当训练模型速度不理想时，很难判断问题出在哪里，只能求助硬件厂商，也失去了主动权和效率。CANN的解决方案是，通过架构升级实现分层解耦，支持开发者从模型、算子、内核以及底层资源按需调用，还专门构建了完备的编程体系，例如Ascend C编程语言和CATLASS模板库就能支持开发者自定义，同时还支持Triton、TileLang、FlagTree等Python前端的开源编程框架，让开发者在性能与效率之间实现自由平衡。为了让开发者快速掌握昇腾开发技能，华为还依托昇腾社区建立了完备的知识体系，并明确了开源的节奏规划。9月底，CANN全量算子将开源到GitCode社区，12月底，领域加速库、图引擎、Ascend C、MindIE等软件代码也将陆续上仓，完成昇腾软件开源开放。此外，华为还将每年投入1500P算力和3万片开发板，与全球开发者共同定义技术标准。同时，为了让CANN能够实现更成熟的社区化运作，华为还正式成立了CANN技术指导委员会，这标志着昇腾生态的治理模式全面升级：从华为主导，转变为全球社区共同驱动，由全球开发者共建、共治、共享。除了软件开源之外，硬件开放同样重要。本届全联接大会上，华为发布了Atlas 950和Atlas 960的两款超节点产品，其中Atlas 960支持15488张昇腾卡，FP8算力高达30EFLOPS，互联带宽达34PB/s，较传统架构性能提升超17倍，向全球顶尖算力看齐。张迪煊表示，昇腾要在硬件环节彻底打破壁垒，把模组、标卡、互联协议交到伙伴手中，让更多厂商能够在此基础上打造差异化产品。其中一项重要的内容是灵衢协议。灵衢是华为自主研发的、面向超节点的互联协议，能够以系统级优势弥补算力上的单点差距。与英伟达NVLink相比，灵衢的最大区别就在于开放。此次大会上，华为宣布开放互联协议灵衢2.0技术规范，这也将吸引产业链共同研发配套硬件，构建自主互联生态。在开放硬件的基础上，华为还联合20余家ISV伙伴打造了场景化应用。例如在金融场景中，基于昇腾平台的信贷报告系统，能够在保障数据安全的前提下显著提升处理效率；在医疗场景中，电子病历与教学助手的应用也已进入试点，为医护人员提供更快速的信息检索与辅助决策。从开源开放的软件栈，到开放规范的硬件互联协议，华为构建了一个开放的创新平台，也为千行万业的智能化转型提供了坚实且自主创新的算力底座。华为架「桥」开放的本质，是让选择权回归创造者。华为这一系列开源措施的终极目标，并不是与特定厂商竞争，而是为产业构建一座开放的「桥」。当前AI产业存在一个显著矛盾：算力需求是整体的、连续的，但算力供给却是碎片化的、被锁定的。企业一旦选择某家架构，就被其生态牢牢绑定，迁移成本巨大。这就相当于将所有的算力鸡蛋放在一个篮子里，不仅会在技术路线上受制于人，也可能面临巨大的供应链风险。华为构建的这座桥，首要作用就是把这些碎片连接起来。一方面，通过超节点技术打造顶尖性能；另一方面，坚持硬件开放、软件开源，华为能够华为能够协同生态、赋能伙伴，为产业界提供高效、灵活且强大的算力支撑。对国内产业而言，这座桥提供了自主创新的底层选择，保障了算力供应链的韧性和安全；而对全球开发者而言，CANN技术指导委员会将项目治理社区化，也在对外表明：这座桥的规则不由华为一家决定，而是由全球贡献者共同治理，消除了开发者对垄断的担忧。生态的最后一环是人才。五年前，在2020年，华为就联合教育部把昇腾课程引入高校，加强人工智能的普适教学。如今，昇腾课程不仅从本科普适教学走向了硕博人才的拔尖培养，更得到了来自多个科研团队的技术成果反哺，形成了“产教融合，创新反哺”的良性循环。通过融入主流、定义标准、开源桥接和社区驱动，华为正从生态的适配者转变为标准的推动者。更重要的是，华为邀请全球开发者共同参与标准定义、主导AI计算发展方向，从而打造开放、透明、由社区驱动的计算新范式，这也是此前没有中国厂商能够达到的生态战略高度。华为的实践也证明，技术自主与全球协作并非对立，而是可以通过开放开源的方式实现统一。封闭生态的叙事固然有吸引力，它背后是难以想象的商业利益。但如果跳出单一的商业逻辑，开放或许才是更可持续的发展哲学——所有后来的参与者，都有机会享受到技术进步的红利。这才是华为在AI时代的战略内涵。其竞争维度已不再是单一产品，而是为整个产业打下开放的根基：不造封闭的花园，造孕育文明的土壤；不做规则下的玩家；做定义规则的基石。文章原文