从“可用”到“好用”,国产算力跨越了吗?四小龙财报背后的喜与忧

Wait 5 sec.

2025年12月至2026年初,短短一个多月内,摩尔线程、沐曦股份相继登陆科创板,壁仞科技、天数智芯扎堆港股挂牌。四家头顶“国产GPU四小龙”光环的企业集体完成资本化跨越,合计募资规模超百亿港元。国产算力芯片赛道,终于从漫长的“PPT造芯”阶段,迈入了接受财报检验的“交卷时刻”。国产算力的2025年,是一场关于“证明”的年份——证明国产GPU可以规模化量产,证明万卡集群能够稳定运行,证明资本市场愿意为国产算力的未来下注,证明国产算力能撑得起万亿甚至更高的市场。最近一段时间,多家国产芯片公司先后发布了上市后首份年度财报,综合数据来看,各家公司营业收入全线大幅增长,但集体亏损的格局也昭示着这个行业的真实处境。在AI算力需求从训练逐步向推理转移的大背景下,国产算力究竟走到了哪一步?国产算力交出“完美”答卷2025年,沐曦股份以16.44亿元的营收规模领跑四小龙,同比增长121.26%;归母净利润亏损7.89亿元,较上年同期大幅收窄43.97%。公司近三年营收从2023年的0.53亿元跃升至2025年的16.44亿元,三年间收入规模增长超过30倍。营收增长的核心驱动力来自GPU产品销量的大幅放量——2025年以曦云C系列为主的训推一体GPU板卡销量达33649片,同比增长147.31%,截至报告期末公司GPU产品累计销量已超过5.5万颗。与此同时,沐曦依然保持高强度研发投入,2025年研发费用为10.27亿元,较上年同期增长14.04%,占营业收入比例高达62.49%。摩尔线程(688795)2025年实现营收15.05亿元,同比增长243.37%;毛利总额达到9.87亿元,较上年同期增长218.43%;归母净利润、归母扣非净利润分别较上年同期亏损收窄38.16%、33.38%。扣除股份支付影响因素后,2025年净利润亏损6.48亿元,较上年同期收窄8.47亿元,收窄比例达56.65%。同时,摩尔线程(688795)保持了高强度的研发投入,全年研发费用13.05亿元,占比为86.68%。天数智芯2025年实现营收10.34亿元,同比增长91.6%;毛利5.58亿元,同比增长110.5%,毛利增速高于营收增速,经调整净亏损约4.38亿元,同比收窄32.1%。核心通用GPU业务全年收入9.23亿元,同比增长149.6%,占总营收89.3%。细分来看,天垓训练系列收入5.84亿元,同比增长116.7%;智铠推理系列收入3.39亿元,同比大增238.2%——推理业务的爆发式增长,成为天数智芯2025年财报中最亮眼的注脚之一。壁仞科技2025年营收10.35亿元,同比增长207.2%;毛利5.57亿元,同比增长210.8%,毛利率达到53.8%。然而,公司年内亏损为164.93亿元,同比扩大972.3%——这一数字乍看惊人,但公司解释称主要与赎回负债账面值变动、股份为基础的薪酬开支以及上市费用有关;剔除这些因素后,经调整年内亏损为8.74亿元。研发投入14.76亿元,同比增长78.5%,主要用于新一代GPU架构及AI软件平台的迭代升级。2025年,壁仞科技完成了旗舰通用GPU产品BR106及BR166的全形态量产与规模交付,其中BR166系列于2025年8月开始量产,在不到半年的销售时间内便快速落地,成为营收跨越式增长的核心驱动力。从行业整体来看,2025年四家国产GPU厂商营业收入均大幅增长,但仍集体亏损。摩尔线程、沐曦股份、天数智芯亏损同比收窄,壁仞科技因研发开支增长等影响亏损规模有所扩大。沙利文中国咨询顾问池钰曾向媒体表示,从行业阶段来看,国产GPU还处在比较早期的快速发展阶段,即便是目前相对靠前的企业,与英伟达这类海外成熟厂商仍存在明显差距。从“能用”到“好用”,国产算力仍面临挑战财报数字的火热,不能掩盖国产算力厂商正在面临的深层挑战。这其中,最为紧要的就是提升集群稳定性和工程化的能力。大模型训练对算力集群的稳定性提出了极高要求。摩尔线程相关技术负责人坦言,用户在选择国产算力时最关心的问题中,“集群长期稳定性”被排在首位,其次才是“框架兼容性和迁移成本”与实际训推性能。这个排序本身就说明了一个事实:对于真正做大模型训练的企业来说,性能差一点可以接受,但训练任务频繁中断、需要反复回滚 checkpoint,可能才是真正的噩梦。“摩尔线程基于MTT S5000打造的夸娥万卡集群,浮点运算能力达10 Exa-Flops,在Dense模型训练中MFU达60%,在MoE模型中维持在40%左右,有效训练时间占比超过90%,训练线性扩展效率达到95%。”该名负责人介绍。但在实际行业环境中,万卡级AI集群的稳定性管理仍是一道高难度考题。据行业媒体披露,当前万卡级别的AI集群平均每天会出现一次甚至多次故障,故障来源包括GPU HBM显存错误、高速互联链路抖动、散热不均导致的热节流、甚至电源模块波动等。这不仅是国产算力的挑战,也是全球AI基础设施面临的共性难题——即便英伟达的DGX SuperPOD,在实际运行中也难以做到完全无中断。国产厂商在稳定性方面的劣势,更多体现在工程经验的积累深度上。英伟达在过去十年中部署了数百个大规模集群,积累了海量的故障模式和调优经验,这些Know-How是无法通过“堆人”快速追赶的。国产厂商往往在实验室环境下跑通了万卡互联,但一旦进入客户真实的生产环境,面对复杂的网络拓扑、混合负载调度、以及非理想条件下的长时间运行,各种“意想不到”的问题就会暴露出来。其次,生态的建设也是国产算力老生常谈的话题。当前,国产GPU厂商普遍选择了“兼容生态”的务实路径。摩尔线程相关技术负责人表示,其自主研发的MUSA架构对英伟达CUDA具备优良的兼容性,通过MUSIFY自动移植工具,开发者能够以最小成本将国际主流GPU平台应用移植至MUSA GPU,大幅提升应用移植的效率,缩短开发周期。天数智芯和壁仞科技同样在软件栈层面投入大量资源,确保PyTorch、TensorFlow、Megatron-LM等主流框架能够在其硬件上高效运行。然而,兼容模式在缩短市场导入期的同时,也带来了一个结构性的困境:开发者习惯被锁定在CUDA生态中,国产平台始终停留在“生态附庸”的位置。更深层的问题在于,兼容路线在管理决策上看似捷径,但代价可能是沉重的:国产GPU厂商需要警惕永远做“生态跟随者”的风险。英伟达的护城河从来不只是硬件算力,而是CUDA生态过去十五年积累的数百万开发者、数千个加速库以及海量的应用案例。要想从“兼容”走向“主导”,国产厂商必须找到一种方式,让开发者愿意主动为国产平台编写原生代码、贡献开源库,而不是仅仅把这里当作CUDA的“备胎”。摩尔线程和沐曦股份已经意识到这一点。摩尔线程除了提供MUSIFY自动移植工具外,还开源了Torch-MUSA、vLLM-MUSA等多个软件库,试图逐步培育MUSA原生生态。沐曦则以“1+6+X”战略构建产业生态圈,以数字算力底座为核心,在六大重点行业推动国产GPU的深度渗透。但生态建设非一日之功,需要持续数年甚至十年的投入,以及足够的用户规模来形成正反馈循环。“条条大路通罗马”面对挑战,国产算力厂商正在用各自的方式寻找破局之路。从已披露的战略布局来看,差异化正成为这一轮竞争的主旋律,即便选择的路径不同,但他们目标却是相似的——如何提升国产算力。壁仞科技的战略方向,可以概括为"系统先行,推理卡位"。2025年,公司交付了2048卡光互连光交换GPU超节点集群。但集群的实际运行效率和商业化落地效果,仍有待更大规模部署的检验。在产品迭代方面,壁仞科技计划于2026年推出下一代BR20X芯片及全系列产品,在保持训练优势的同时,为推理需求进行优化——算力密度、内存容量和带宽、互连能力升级,支持FP8/FP4等低精度计算。截至2025年末,壁仞科技持有现金及金融资产共28.96亿元,加上2026年初上市募集的56.31亿元,账面资金较为充裕。不过,对于一家仍处于大规模研发投入期的芯片企业而言,这些资金能在多长时间内支撑其技术迭代与市场扩张,仍是外界关注的问题。天数智芯选择了一条更具进攻性的路线。今年1月,公司公布了芯片四代架构路线图:2025年天数天枢架构超越英伟达Hopper,2026年天数天璇架构对标Blackwell、天数天玑架构超越Blackwell,2027年天数天权架构超越Rubin,之后转向突破性计算芯片架构设计。这一路线图的技术承诺最终需要实际产品来兑现,目前尚未有第三方基准测试数据公开验证其性能宣称。在商业化方面,天数智芯已累计服务超340家客户,产品及解决方案在互联网、AI大模型、科研、金融、医疗、教育等领域部署超1000项。公司还推出了面向机器人、智能终端等领域的彤央系列端侧算力产品。四代架构路线图的发布与边端产品的亮相,显示出天数智芯试图在训练、推理和边缘计算三个维度同时发力。但多线作战也意味着研发资源的分散,其能否在任一领域建立足够深的护城河,仍需观察。沐曦股份的策略则可以概括为"产品全栈化,生态开源化"。在产品端,公司已形成曦云C系列(训推一体与通用计算)、曦思N系列(AI推理)、曦彩G系列(图形渲染)、曦索X系列(科学智能)四大GPU产品矩阵。2025年7月,首款基于全国产工艺的曦云C600系列在WAIC大会发布,已于2025年末实现风险量产,预计2026年上半年量产销售。但需要指出的是,"全国产工艺"在当前语境下通常指代特定制程节点,其与行业最先进制程的性能差距,是评估产品竞争力的关键变量。面向科学智能场景的曦索X系列首款产品X206配备128GB超大容量显存,于2026年1月正式面世。沐曦计划2026年进一步推进曦索X206、曦云C700等下一代产品的研发及产业化。上市募集资金净额约38.99亿元,将分三至四年投入新型高性能通用GPU研发及产业化等方向。资金分三至四年投入,意味着短期内难以看到全部成果,技术迭代节奏与市场竞争窗口的匹配度,将是其面临的主要考验。与专注AI计算的同行不同,摩尔线程坚持全功能GPU路线,从游戏显卡到AI计算试图覆盖多个场景。这种路径的优势在于覆盖面广,但同时也意味着在每一细分领域都可能面临更专注竞争对手的挑战。摩尔线程的GPU支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码,并声称是国内极少数原生支持从FP8到FP64全计算精度的厂商。在集群工程化能力上,摩尔线程已推出新一代全功能GPU架构"花港",可支持十万卡以上规模的智算集群扩展。其在科学计算和生物制药等垂直领域的表现尤为突出——据公司披露,在分子动力学引擎SPONGE中,MTT S5000性能达到国际旗舰产品的1.7倍;在生物制药分子对接工具DSDP中,性能达到8.1倍。上述数据均来自公司自身披露,尚未有独立第三方在标准化测试环境下的验证结果。这种在特定垂直领域建立的优势,能否转化为可持续的商业模式,仍有待观察。除了“四小龙”之外,华为昇腾和寒武纪同样是国产算力版图中不可忽视的力量。据行业分析机构披露,英伟达在中国AI加速卡市场的份额已从制裁前的约95%大幅下降至55%左右,2025年国产厂商合计出货量达165万张,占比约41%,其中华为以81.2万颗领跑国产阵营。寒武纪2025年营收达64.97亿元,同比增长453%,实现净利润20.59亿元。这些数据表明,国产算力替代的整体进程正在加速,而“四小龙”面临的竞争格局远比想象中的更复杂——它们不仅要追赶英伟达,还要与华为、寒武纪等本土玩家同台竞技。2026年,对于国产算力而言,证明的阶段或许正在转向“超越”——超越的不仅是国际对手的技术指标,更是用户对国产算力的信任阈值。正如弗若斯特沙利文数据所预测的,国产通用GPU产品占比有望从2024年的17.4%提升至2029年的超过50%。市场份额的跃迁背后,是技术、生态、工程化能力与商业模式的系统性较量。而对于国产算力上市公司而言,上市之后的新课题才刚刚开始:如何在高强度研发投入与可持续盈利之间找到平衡?如何在兼容生态与自主创新之间走出一条独特的路?如何在训练需求与推理爆发的结构性切换中抢得先机?(文|Leo张ToB杂谈,作者|张申宇,编辑丨杨林)更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App