从“可用”到“好用”，国产算力跨越了吗？四小龙财报背后的喜与忧

Wait 5 sec.

2025年12月至2026年初，短短一个多月内，摩尔线程、沐曦股份相继登陆科创板，壁仞科技、天数智芯扎堆港股挂牌。四家头顶“国产GPU四小龙”光环的企业集体完成资本化跨越，合计募资规模超百亿港元。国产算力芯片赛道，终于从漫长的“PPT造芯”阶段，迈入了接受财报检验的“交卷时刻”。国产算力的2025年，是一场关于“证明”的年份——证明国产GPU可以规模化量产，证明万卡集群能够稳定运行，证明资本市场愿意为国产算力的未来下注，证明国产算力能撑得起万亿甚至更高的市场。最近一段时间，多家国产芯片公司先后发布了上市后首份年度财报，综合数据来看，各家公司营业收入全线大幅增长，但集体亏损的格局也昭示着这个行业的真实处境。在AI算力需求从训练逐步向推理转移的大背景下，国产算力究竟走到了哪一步？国产算力交出“完美”答卷2025年，沐曦股份以16.44亿元的营收规模领跑四小龙，同比增长121.26%；归母净利润亏损7.89亿元，较上年同期大幅收窄43.97%。公司近三年营收从2023年的0.53亿元跃升至2025年的16.44亿元，三年间收入规模增长超过30倍。营收增长的核心驱动力来自GPU产品销量的大幅放量——2025年以曦云C系列为主的训推一体GPU板卡销量达33649片，同比增长147.31%，截至报告期末公司GPU产品累计销量已超过5.5万颗。与此同时，沐曦依然保持高强度研发投入，2025年研发费用为10.27亿元，较上年同期增长14.04%，占营业收入比例高达62.49%。摩尔线程（688795）2025年实现营收15.05亿元，同比增长243.37%；毛利总额达到9.87亿元，较上年同期增长218.43%；归母净利润、归母扣非净利润分别较上年同期亏损收窄38.16%、33.38%。扣除股份支付影响因素后，2025年净利润亏损6.48亿元，较上年同期收窄8.47亿元，收窄比例达56.65%。同时，摩尔线程（688795）保持了高强度的研发投入，全年研发费用13.05亿元，占比为86.68%。天数智芯2025年实现营收10.34亿元，同比增长91.6%；毛利5.58亿元，同比增长110.5%，毛利增速高于营收增速，经调整净亏损约4.38亿元，同比收窄32.1%。核心通用GPU业务全年收入9.23亿元，同比增长149.6%，占总营收89.3%。细分来看，天垓训练系列收入5.84亿元，同比增长116.7%；智铠推理系列收入3.39亿元，同比大增238.2%——推理业务的爆发式增长，成为天数智芯2025年财报中最亮眼的注脚之一。壁仞科技2025年营收10.35亿元，同比增长207.2%；毛利5.57亿元，同比增长210.8%，毛利率达到53.8%。然而，公司年内亏损为164.93亿元，同比扩大972.3%——这一数字乍看惊人，但公司解释称主要与赎回负债账面值变动、股份为基础的薪酬开支以及上市费用有关；剔除这些因素后，经调整年内亏损为8.74亿元。研发投入14.76亿元，同比增长78.5%，主要用于新一代GPU架构及AI软件平台的迭代升级。2025年，壁仞科技完成了旗舰通用GPU产品BR106及BR166的全形态量产与规模交付，其中BR166系列于2025年8月开始量产，在不到半年的销售时间内便快速落地，成为营收跨越式增长的核心驱动力。从行业整体来看，2025年四家国产GPU厂商营业收入均大幅增长，但仍集体亏损。摩尔线程、沐曦股份、天数智芯亏损同比收窄，壁仞科技因研发开支增长等影响亏损规模有所扩大。沙利文中国咨询顾问池钰曾向媒体表示，从行业阶段来看，国产GPU还处在比较早期的快速发展阶段，即便是目前相对靠前的企业，与英伟达这类海外成熟厂商仍存在明显差距。从“能用”到“好用”，国产算力仍面临挑战财报数字的火热，不能掩盖国产算力厂商正在面临的深层挑战。这其中，最为紧要的就是提升集群稳定性和工程化的能力。大模型训练对算力集群的稳定性提出了极高要求。摩尔线程相关技术负责人坦言，用户在选择国产算力时最关心的问题中，“集群长期稳定性”被排在首位，其次才是“框架兼容性和迁移成本”与实际训推性能。这个排序本身就说明了一个事实：对于真正做大模型训练的企业来说，性能差一点可以接受，但训练任务频繁中断、需要反复回滚 checkpoint，可能才是真正的噩梦。“摩尔线程基于MTT S5000打造的夸娥万卡集群，浮点运算能力达10 Exa-Flops，在Dense模型训练中MFU达60%，在MoE模型中维持在40%左右，有效训练时间占比超过90%，训练线性扩展效率达到95%。”该名负责人介绍。但在实际行业环境中，万卡级AI集群的稳定性管理仍是一道高难度考题。据行业媒体披露，当前万卡级别的AI集群平均每天会出现一次甚至多次故障，故障来源包括GPU HBM显存错误、高速互联链路抖动、散热不均导致的热节流、甚至电源模块波动等。这不仅是国产算力的挑战，也是全球AI基础设施面临的共性难题——即便英伟达的DGX SuperPOD，在实际运行中也难以做到完全无中断。国产厂商在稳定性方面的劣势，更多体现在工程经验的积累深度上。英伟达在过去十年中部署了数百个大规模集群，积累了海量的故障模式和调优经验，这些Know-How是无法通过“堆人”快速追赶的。国产厂商往往在实验室环境下跑通了万卡互联，但一旦进入客户真实的生产环境，面对复杂的网络拓扑、混合负载调度、以及非理想条件下的长时间运行，各种“意想不到”的问题就会暴露出来。其次，生态的建设也是国产算力老生常谈的话题。当前，国产GPU厂商普遍选择了“兼容生态”的务实路径。摩尔线程相关技术负责人表示，其自主研发的MUSA架构对英伟达CUDA具备优良的兼容性，通过MUSIFY自动移植工具，开发者能够以最小成本将国际主流GPU平台应用移植至MUSA GPU，大幅提升应用移植的效率，缩短开发周期。天数智芯和壁仞科技同样在软件栈层面投入大量资源，确保PyTorch、TensorFlow、Megatron-LM等主流框架能够在其硬件上高效运行。然而，兼容模式在缩短市场导入期的同时，也带来了一个结构性的困境：开发者习惯被锁定在CUDA生态中，国产平台始终停留在“生态附庸”的位置。更深层的问题在于，兼容路线在管理决策上看似捷径，但代价可能是沉重的：国产GPU厂商需要警惕永远做“生态跟随者”的风险。英伟达的护城河从来不只是硬件算力，而是CUDA生态过去十五年积累的数百万开发者、数千个加速库以及海量的应用案例。要想从“兼容”走向“主导”，国产厂商必须找到一种方式，让开发者愿意主动为国产平台编写原生代码、贡献开源库，而不是仅仅把这里当作CUDA的“备胎”。摩尔线程和沐曦股份已经意识到这一点。摩尔线程除了提供MUSIFY自动移植工具外，还开源了Torch-MUSA、vLLM-MUSA等多个软件库，试图逐步培育MUSA原生生态。沐曦则以“1+6+X”战略构建产业生态圈，以数字算力底座为核心，在六大重点行业推动国产GPU的深度渗透。但生态建设非一日之功，需要持续数年甚至十年的投入，以及足够的用户规模来形成正反馈循环。“条条大路通罗马”面对挑战，国产算力厂商正在用各自的方式寻找破局之路。从已披露的战略布局来看，差异化正成为这一轮竞争的主旋律，即便选择的路径不同，但他们目标却是相似的——如何提升国产算力。壁仞科技的战略方向，可以概括为"系统先行，推理卡位"。2025年，公司交付了2048卡光互连光交换GPU超节点集群。但集群的实际运行效率和商业化落地效果，仍有待更大规模部署的检验。在产品迭代方面，壁仞科技计划于2026年推出下一代BR20X芯片及全系列产品，在保持训练优势的同时，为推理需求进行优化——算力密度、内存容量和带宽、互连能力升级，支持FP8/FP4等低精度计算。截至2025年末，壁仞科技持有现金及金融资产共28.96亿元，加上2026年初上市募集的56.31亿元，账面资金较为充裕。不过，对于一家仍处于大规模研发投入期的芯片企业而言，这些资金能在多长时间内支撑其技术迭代与市场扩张，仍是外界关注的问题。天数智芯选择了一条更具进攻性的路线。今年1月，公司公布了芯片四代架构路线图：2025年天数天枢架构超越英伟达Hopper，2026年天数天璇架构对标Blackwell、天数天玑架构超越Blackwell，2027年天数天权架构超越Rubin，之后转向突破性计算芯片架构设计。这一路线图的技术承诺最终需要实际产品来兑现，目前尚未有第三方基准测试数据公开验证其性能宣称。在商业化方面，天数智芯已累计服务超340家客户，产品及解决方案在互联网、AI大模型、科研、金融、医疗、教育等领域部署超1000项。公司还推出了面向机器人、智能终端等领域的彤央系列端侧算力产品。四代架构路线图的发布与边端产品的亮相，显示出天数智芯试图在训练、推理和边缘计算三个维度同时发力。但多线作战也意味着研发资源的分散，其能否在任一领域建立足够深的护城河，仍需观察。沐曦股份的策略则可以概括为"产品全栈化，生态开源化"。在产品端，公司已形成曦云C系列（训推一体与通用计算）、曦思N系列（AI推理）、曦彩G系列（图形渲染）、曦索X系列（科学智能）四大GPU产品矩阵。2025年7月，首款基于全国产工艺的曦云C600系列在WAIC大会发布，已于2025年末实现风险量产，预计2026年上半年量产销售。但需要指出的是，"全国产工艺"在当前语境下通常指代特定制程节点，其与行业最先进制程的性能差距，是评估产品竞争力的关键变量。面向科学智能场景的曦索X系列首款产品X206配备128GB超大容量显存，于2026年1月正式面世。沐曦计划2026年进一步推进曦索X206、曦云C700等下一代产品的研发及产业化。上市募集资金净额约38.99亿元，将分三至四年投入新型高性能通用GPU研发及产业化等方向。资金分三至四年投入，意味着短期内难以看到全部成果，技术迭代节奏与市场竞争窗口的匹配度，将是其面临的主要考验。与专注AI计算的同行不同，摩尔线程坚持全功能GPU路线，从游戏显卡到AI计算试图覆盖多个场景。这种路径的优势在于覆盖面广，但同时也意味着在每一细分领域都可能面临更专注竞争对手的挑战。摩尔线程的GPU支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码，并声称是国内极少数原生支持从FP8到FP64全计算精度的厂商。在集群工程化能力上，摩尔线程已推出新一代全功能GPU架构"花港"，可支持十万卡以上规模的智算集群扩展。其在科学计算和生物制药等垂直领域的表现尤为突出——据公司披露，在分子动力学引擎SPONGE中，MTT S5000性能达到国际旗舰产品的1.7倍；在生物制药分子对接工具DSDP中，性能达到8.1倍。上述数据均来自公司自身披露，尚未有独立第三方在标准化测试环境下的验证结果。这种在特定垂直领域建立的优势，能否转化为可持续的商业模式，仍有待观察。除了“四小龙”之外，华为昇腾和寒武纪同样是国产算力版图中不可忽视的力量。据行业分析机构披露，英伟达在中国AI加速卡市场的份额已从制裁前的约95%大幅下降至55%左右，2025年国产厂商合计出货量达165万张，占比约41%，其中华为以81.2万颗领跑国产阵营。寒武纪2025年营收达64.97亿元，同比增长453%，实现净利润20.59亿元。这些数据表明，国产算力替代的整体进程正在加速，而“四小龙”面临的竞争格局远比想象中的更复杂——它们不仅要追赶英伟达，还要与华为、寒武纪等本土玩家同台竞技。2026年，对于国产算力而言，证明的阶段或许正在转向“超越”——超越的不仅是国际对手的技术指标，更是用户对国产算力的信任阈值。正如弗若斯特沙利文数据所预测的，国产通用GPU产品占比有望从2024年的17.4%提升至2029年的超过50%。市场份额的跃迁背后，是技术、生态、工程化能力与商业模式的系统性较量。而对于国产算力上市公司而言，上市之后的新课题才刚刚开始：如何在高强度研发投入与可持续盈利之间找到平衡？如何在兼容生态与自主创新之间走出一条独特的路？如何在训练需求与推理爆发的结构性切换中抢得先机？（文｜Leo张ToB杂谈，作者｜张申宇，编辑丨杨林）更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App