华为昇腾全面开源开放,释放了哪些信号?

Wait 5 sec.

商业世界里所有生态的博弈,从来不止是技术的竞速,更是开放性的较量。当技术的壁垒被打破,当协作的门槛被降低,创新的洪流就会奔涌而出。如今,在如火如荼的AI计算产业,一场开源实践也正在悄然酝酿。在华为全联接大会2025期间,华为宣布昇腾将分层解耦、全面开源开放,支持Triton、PyTorch、vLLM、verl等主流社区,并成立CANN(Compute Architecture for Neural Networks,由华为推出的神经网络异构计算架构)技术指导委员会,推动生态走向社区化治理。与此同时,华为还推出了创新的超节点架构,发布标卡、模组、服务器、集群等多款最新的超节点产品,覆盖小型工作站、企业级数据中心、大型数据中心等多个场景。华为董事、ICT BG CEO杨超斌表示,将坚持硬件开放、软件开源,支持伙伴打造面向行业的超节点场景化解决方案。不难看出,华为的所有动作都离不开一个关键词:开放。对渴望打破算力垄断的全球AI计算产业而言,开放究竟意味着什么?打破封闭的藩篱读懂昇腾的开放策略,首先要理解何为CANN。CANN的全称是“神经网络异构计算架构”(Compute Architecture for Neural Networks)。通俗地说,它是把上层AI训练框架(如PyTorch、TensorFlow、MindSpore等)和底层昇腾芯片连接起来的桥梁,作用在于最大化地释放GPU的潜力。当前,业内最知名的异构计算架构莫过于英伟达的CUDA。作为英伟达的核心技术平台,CUDA不仅推动了 GPU 从图形处理单元向通用计算平台的转变,还构建了一个庞大且高质量的开发者生态系统。如今整个AI开发生态大多构建在 CUDA 的基础之上,这也使得英伟达在AI大潮中占据了不可替代的位置。在相当长的一段时间里,CUDA都难寻对手,原因正是这个强大的软硬件协同生态系统,开发者可以借此在GPU上实现高效的并行计算。但这个系统存在一个短板:封闭。开发者一旦进入CUDA生态就很难再脱离,因为要转向其他GPU框架,意味着重写代码、重学新工具,存在巨大的转换成本。英伟达创始人黄仁勋曾明确表示,绝不会将CUDA开源。对英伟达而言,这是维护其技术垄断地位的一种策略,但也无形中限制了开发者的选择。挑战封闭的最佳手段,就是开放。早在2018年,华为就提出了「全栈全场景AI解决方案」,旨在形成从芯片(昇腾)、芯片使能(CANN)到AI框架(MindSpore)及应用的一套完整AI基础设施。其中,CANN是昇腾AI计算产业的核心基础软件,也是其挑战行业垄断的战略支点。一个重要的里程碑是,2025年8月,华为轮值董事长徐直军宣布CANN全面开源开放。这是华为向外界释放的一个重要信号——华为决心打破AI算力领域的封闭格局,将底层技术的选择权交还给开发者,也为世界提供CUDA之外的新选择。从开源鸿蒙、鲲鹏、欧拉到CANN,华为早已将开源开放刻入自身的技术基因。作为全球20多个开源基金会的创始成员或顶级成员,华为已累计在300多个上游社区成为核心代码贡献者。背后的根本逻辑是,在基础软件和根技术领域,生态的繁荣远比单一的硬件性能更重要。只有打破封闭的藩篱,形成创新合力,才能构建起坚固的数字根基。软件开源,硬件开放要开辟一个全新的生态,华为的诚意是什么?按照华为公司副总裁、昇腾计算业务总裁张迪煊的说法,昇腾将分层解耦、全面开源开放,并全面支持Triton、PyTorch、vLLM、verl等主流社区。这可以视为,华为向全球AI开发者敞开了底层算力架构的大门。传统AI开发中,硬件底层往往是一个「黑盒」,就像是驾驶一辆引擎盖被焊死的汽车,能踩油门、转方向盘,但对引擎内部一无所知。这就是开发者面对传统AI硬件的桎梏:当训练模型速度不理想时,很难判断问题出在哪里,只能求助硬件厂商,也失去了主动权和效率。CANN的解决方案是,通过架构升级实现分层解耦,支持开发者从模型、算子、内核以及底层资源按需调用,还专门构建了完备的编程体系,例如Ascend C编程语言和CATLASS模板库就能支持开发者自定义,同时还支持Triton、TileLang、FlagTree等Python前端的开源编程框架,让开发者在性能与效率之间实现自由平衡。为了让开发者快速掌握昇腾开发技能,华为还依托昇腾社区建立了完备的知识体系,并明确了开源的节奏规划。9月底,CANN全量算子将开源到GitCode社区,12月底,领域加速库、图引擎、Ascend C、MindIE等软件代码也将陆续上仓,完成昇腾软件开源开放。此外,华为还将每年投入1500P算力和3万片开发板,与全球开发者共同定义技术标准。同时,为了让CANN能够实现更成熟的社区化运作,华为还正式成立了CANN技术指导委员会,这标志着昇腾生态的治理模式全面升级:从华为主导,转变为全球社区共同驱动,由全球开发者共建、共治、共享。除了软件开源之外,硬件开放同样重要。本届全联接大会上,华为发布了Atlas 950和Atlas 960的两款超节点产品,其中Atlas 960支持15488张昇腾卡,FP8算力高达30EFLOPS,互联带宽达34PB/s,较传统架构性能提升超17倍,向全球顶尖算力看齐。张迪煊表示,昇腾要在硬件环节彻底打破壁垒,把模组、标卡、互联协议交到伙伴手中,让更多厂商能够在此基础上打造差异化产品。其中一项重要的内容是灵衢协议。灵衢是华为自主研发的、面向超节点的互联协议,能够以系统级优势弥补算力上的单点差距。与英伟达NVLink相比,灵衢的最大区别就在于开放。此次大会上,华为宣布开放互联协议灵衢2.0技术规范,这也将吸引产业链共同研发配套硬件,构建自主互联生态。在开放硬件的基础上,华为还联合20余家ISV伙伴打造了场景化应用。例如在金融场景中,基于昇腾平台的信贷报告系统,能够在保障数据安全的前提下显著提升处理效率;在医疗场景中,电子病历与教学助手的应用也已进入试点,为医护人员提供更快速的信息检索与辅助决策。从开源开放的软件栈,到开放规范的硬件互联协议,华为构建了一个开放的创新平台,也为千行万业的智能化转型提供了坚实且自主创新的算力底座。华为架「桥」开放的本质,是让选择权回归创造者。华为这一系列开源措施的终极目标,并不是与特定厂商竞争,而是为产业构建一座开放的「桥」。当前AI产业存在一个显著矛盾:算力需求是整体的、连续的,但算力供给却是碎片化的、被锁定的。企业一旦选择某家架构,就被其生态牢牢绑定,迁移成本巨大。这就相当于将所有的算力鸡蛋放在一个篮子里,不仅会在技术路线上受制于人,也可能面临巨大的供应链风险。华为构建的这座桥,首要作用就是把这些碎片连接起来。一方面,通过超节点技术打造顶尖性能;另一方面,坚持硬件开放、软件开源,华为能够华为能够协同生态、赋能伙伴,为产业界提供高效、灵活且强大的算力支撑。对国内产业而言,这座桥提供了自主创新的底层选择,保障了算力供应链的韧性和安全;而对全球开发者而言,CANN技术指导委员会将项目治理社区化,也在对外表明:这座桥的规则不由华为一家决定,而是由全球贡献者共同治理,消除了开发者对垄断的担忧。生态的最后一环是人才。五年前,在2020年,华为就联合教育部把昇腾课程引入高校,加强人工智能的普适教学。如今,昇腾课程不仅从本科普适教学走向了硕博人才的拔尖培养,更得到了来自多个科研团队的技术成果反哺,形成了“产教融合,创新反哺”的良性循环。通过融入主流、定义标准、开源桥接和社区驱动,华为正从生态的适配者转变为标准的推动者。更重要的是,华为邀请全球开发者共同参与标准定义、主导AI计算发展方向,从而打造开放、透明、由社区驱动的计算新范式,这也是此前没有中国厂商能够达到的生态战略高度。华为的实践也证明,技术自主与全球协作并非对立,而是可以通过开放开源的方式实现统一。封闭生态的叙事固然有吸引力,它背后是难以想象的商业利益。但如果跳出单一的商业逻辑,开放或许才是更可持续的发展哲学——所有后来的参与者,都有机会享受到技术进步的红利。这才是华为在AI时代的战略内涵。其竞争维度已不再是单一产品,而是为整个产业打下开放的根基:不造封闭的花园,造孕育文明的土壤;不做规则下的玩家;做定义规则的基石。 文章原文