阶跃+千里模式，“蔚理小小”该有危机感了

Wait 5 sec.

文 | X研究媛大模型港股“双子星”智谱和MiniMax熠熠生辉，股价暴涨，阶跃似乎也按耐不住了。彭博社爆料阶跃即将登陆港股。仅仅一个月前，阶跃星辰才官宣完成B+轮超50亿的融资，超过智谱和MiniMax的上市募资金额。外面的通稿说，这50亿人民币押注的，是大模型落地的第一大“端口”，车；50亿对价的是基础大模型商业潜力，未来的想象力变现，比如机器人。与资本押注阶跃AI+车、AI+终端的预期不同，智谱和MiniMax最近夸张的市值攀升，背后逻辑可能是这两家国产大模型在vibe coding、在基模上站在了技术全球第一梯队，它们拿出了超出预期的产品硬通货。大模型时代，技术实力直接等同于商业潜力，有强悍技术就有品牌影响力、口碑、用户。智谱和MiniMax之后，阶跃登陆港股会讲一个什么故事？出任阶跃董事长的清华姚班AI天才印奇，在AI 1.0 深度学习CV和NLP时代郁郁不得志，2.0大模型时代直接“满配”——左手阶跃右手千里，引入荣耀前CEO赵明完成“AI+车”商业闭环。当阶跃和千里深度绑定，直奔“特斯拉+xAI”模式，顶尖大模型赋能的智驾，巨量的车端数据，有切换玩法清空积累重置系统的威力。阶跃融50亿后再登陆港股，未来冲击的可能是八杆子打不着的“蔚理小小”，它们花大力气自建的智驾和基模，可能还不如第三方，它们努力的价值正被稀释，成本风险却在一步步积累。先抛一个暴论：大模型时代，智驾可能会“去车企化”图片来源于《张小珺商业访谈录》大模型吞噬一切，绝不是狼来了的吆喝。当更高维的技术下放的时候，车、机器人、智驾，都会变得“面目全非”，核心技术研发的优先级会重排次序，行业会洗牌，甚至会消亡。智驾技术近年发展轨迹有一条非常清晰的主线：感知、规划、控制层都在快速大模型化，不同传感器数据类型，原来前置的CV算法trick都被纳入统一的端到端神经网络。深度学习开始主导3D重建和运动预测，Transformer架构、强化学习方法、扩散模型、乃至世界模型仿真成为进步的核心驱动力。蔚理小小心里其实非常清楚，三电系统、激光雷达、算力芯片已经收敛成基本透明的标准件，竞争的标尺逐渐让渡于天量的车端驾驶数据如何快速学习和泛化，梯度流动、下降、模型整体的参数收敛，才是重中之重。“我们人类为什么有很强的适应性，是因为我们人类的基础智能非常高。智驾系统，它本质上全链路的模型比例越高，通用智能越强，它未来的适配性就越好。”“含模量是智驾的第一性原理。”走马上任阶跃董事长的印奇在2026CES的这句话，让我印象尤其深。这句话我的延伸理解是：智驾不是智驾，机器人不是机器人，车不是车，手机也不是手机，它都是万千变化的“躯体”，离不开“宗”——智能，是当下站在舞台中心的大模型。车企研发智驾大模型，是从肌肉到大脑的演化，是从下到上。大模型切入智驾和座舱，是大脑某些能力的场景收敛，从上到下。从下到上，和从上到下，过程阻力是不一样的。资本的视角，从终局看，智驾系统将不是单纯车企可以玩转的。蔚小理等车企的“全栈自研”可能正在成为一种高昂的、不可持续的“战术勤奋”，大模型原生企业将接管智驾的终局。长期以来，汽车行业对自动驾驶的理解：认为驾驶是一项特定任务。在这个逻辑下，只要给机器足够多的感知数据（视觉、雷达）、足够精细的高精地图、足够复杂的控制逻辑，就能解决驾驶问题。然而，2026 年的共识是：智驾系统不是机器视觉的延伸，而是通用智能（AGI）在物理世界的一次具身投射。 驾驶不仅是路况识别，它是对物理规律的理解、对人类博弈心理的捕捉，以及对万物常识的调取。这种“全脑参与”的智能，决定了只有顶尖的基础大模型（Foundation Model）才能收敛出顶尖的智驾系统。而这正是自研车企很难跨越的鸿沟。智驾从“模块化编程”到“端到端大模型”，这种范式转移不仅仅是代码量的增加，而是底座的某种彻底重构。车企正面临从“制造逻辑”向“计算逻辑”转型，这个过程注定非常艰难。李想谈“理想”要转型AI 公司，目标国内大模型Top3，背后是有巨大的危机意识。只学开车，可能永远不会开车驾驶中包含了大量的“非驾驶知识”。人类在驾驶时，并非只在观察车道线和障碍物。它有物理常识的推演。比如当你看到路边有一个滚动的皮球，你的大脑会瞬间跳过“检测到圆形物体”的步骤，直接给出“后方可能有小孩冲出”的预测。这种推理依赖于对社会学、人类行为学和物理惯性的深刻理解。更有语义理解的博弈。在狭窄小巷遇到对向来车，司机之间的眼神交流、微小的车头挪动、甚至对对方车型（如对方是急救车还是私家车）的认知，决定了博弈的胜负。当车企智驾系统过拟合（Overfitting），它们在海量的驾驶数据中寻找相关性，而非因果律。这种基于模式识别的“小聪明”，在面对极长尾的 Edge Cases（边缘场景）时会瞬间崩塌。智驾系统泛化到极端场景，而且不仅仅是在最后一刻做出反应，而是具有“前瞻性的安全性”（proactively safe）。特斯拉AI和自动驾驶负责人Ashok在Tesla ICCV 2025 Foundational Model for FSD展示了一个让人印象极其深刻的例子。这是一个自动驾驶系统在高速公路上运行的演示。“我们前面的车失控了，撞上了护栏，自动驾驶系统安全地靠边停车了。但真正有意思的是，如果你再看一遍视频，在刹车的那个点暂停。如果你注意到这辆车，它正在失控打转，即将撞上护栏，然后会反弹回我们的车道。这需要极高的智能才能预判到。”图片来源于公开演讲“这不是一个“一阶碰撞”（first order collision）。在这一帧，特斯拉就已经判断出这辆车有问题了，并开始刹车。它没有等到那辆车撞上护栏反弹回来，或者速度发生变化时才反应。这是一个它需要建模的“二阶效应”（second order effect）。”图片来源于公开演讲“它本可以把这误判为那辆车在变道，但它没有。它请求了大约 4 米每平方秒的刹车加速度，这不是一个轻微的刹车。这只有在你拥有海量数据、覆盖了所有这些极端案例的情况下才可能做到。这就是你如何通过一个拥有海量数据的端到端系统，来同时提供安全且平稳的驾乘体验。因为一个不够智能的系统会等到方向改变或坏事实际发生后才行动，而（特斯拉的FSD）远在此之前就已经（预判）了。”FSD 可以识别随机路人的手势，招手停车，挥手通行。FSDV14版本一段自动停车、用户取餐、刷卡、车辆等待用户拿到信用卡、适时启动更是引发了恐怖谷效应，“它似乎成精了”。FSD已经聪明地不像一个智驾系统，因为特斯拉可能已经先人一步明白，智能上不完备的领域模型其实有根本局限。智能涌现需要冗余，AI Infra是隐形的护城河智驾大模型 vs. 大模型智驾，这里存在一个深刻的悖论：服务于智驾的大模型（Domain-Specific）：它被训练去识别红绿灯、预测轨迹。它的知识边界被限制在路面上，它是一个“优秀的司机”，但它没有“灵魂”（缺乏常识背景）。顶尖的基础大模型：它理解牛顿力学、理解法律道德、理解人类的情绪变化。当它被灌输驾驶数据后，它对路况的理解是更高维、更完备的。从系统完备性角度看，System 1 与 System 2 的融合，全脑参与的驾驶逻辑，才能导向真正的自动驾驶。《思考：快与慢》作者丹尼尔·卡尼曼将人类思维分为：System 1：直觉、本能、快速反应（对应现在的端到端感知规控）。System 2：逻辑、推理、慢速规划（对应智驾系统在复杂路口和情境的思考）。事实上，人类开车是全脑参与。当你看到前方有积水，System 2 会根据天气、气温推测是否结冰，从而指令 System 1 降低车速。车企的自研模型目前大多停留在 System 1 的加强版。由于缺乏基础大模型的支撑，它们没有真正的 System 2。它们能做出“动作”，但不懂“为什么要这么做”。只有原生大模型企业，通过大规模文本与视频的预训练，才具备了生成 System 2 逻辑链的能力。自研车企目前的尴尬在于：为了过测试，模型被训练得极其擅长处理特定的路口、特定的光照。这就是所谓的“过拟合”。而一个顶尖的大模型，它在训练中见识过量子力学、读过世界历史，它掌握的是世界的通用方程。驾驶对它而言，只是这套方程的一个特例。这种“降维打击”带来的鲁棒性，是任何通过路测数据堆砌出来的系统都无法企及的。智驾性能的上限，取决于其背后通用智能的深度。一个缺乏 System 2（慢思考、逻辑推理）能力的智驾系统，几乎无法实现 L4/L5 级的可靠性。人类学习开车只需要 20 小时，是因为人类带上了此前 20 年积累的全部人生常识和物理直觉。如果一个智驾模型只学过开车，那它永远也学不会真正的开车。根据 Scaling Law（规模法则），模型的智能水平与计算量、参数量正相关。车企往往认为，只要我有几千张 H100，就能跑通智驾模型。但这里忽略了一个事实：为了在“驾驶”这一特定任务上获得 1% 的安全性提升，可能需要在“非驾驶”的通用知识上投入 90% 的算力。原生 AI 企业（如 OpenAI, Google, 或顶尖第三方）的万卡、十万卡集群，训练的是能够理解万物的通用底座。在这个底座上通过Alignment（对齐）和 Distillation（蒸馏）出来的智驾能力，具有天然的逻辑自洽性。车企擅长制造硬件，但不擅长管理“算力流”。计算效率上，原生 AI 企业对算子加速、分布式并行架构（TP/PP/DP）的理解是芯片级的。数据质量极其关键，智驾数据中有 99% 是无效的平庸数据，如何从海量视频中提取具备“认知价值”的样本，需要一套极其复杂的自动标注与合成数据系统。更进一步，端到端的神经网络训练完成，还需要在一个虚拟的物理仿真和测试的世界模型中充分测试，实现有效的评估，评估的准确性难度很高但异常关键，它对模型的进化必不可少。数据收集、仿真测试，这一整套系统的复杂度，甚至超过了智驾系统本身。蔚小理目前的毛利空间，根本无法长期支撑每年数十亿甚至上百亿美金的 AGI 级投入。而投入到基座模型训练竞赛，强行偏离主业，效果大概率还不如第三方。从这个角度来讲，车企如果不转向第三方（具备基础大模型能力的企业），其自研系统将迅速沦为“技术负债”。还有AI Infra也是很难越过的门槛。独立基模迭代，“千卡”是门票，“万卡”是竞赛，维持一个万卡 GB200 集群的电费、冷却及运维成本，足以吞噬一家中等车企全年的研发预算。而且车企的算力多为“采购囤积”，缺乏对算力底座的深度优化。蔚小理未来可能意识到：自研大模型不是在造发动机，而是在尝试独立发明一种全新的“机器智能”。面对万卡集群、AI Infra 的极限门槛和通用智能的降维打击，拥抱原生 AI 企业的第三方智驾底座，只有华山一条路。汽车史上，并非每个车企都必须自研喷油系统或变速箱电控。当智驾大模型门槛越来越高，车企应该努力的方向：具身智能的场景定义、品牌情感链接以及整车工程的极致实现。后话智驾系统的终局，不是谁的车跑得公里数多，而是谁背后的基础智能更深厚。资本选择印奇去掌舵阶跃星辰，给了50亿，把千里智驾和基础大模型整合，可能就是基于这一种判断。其实未来焦虑的可能不止车企。大模型时代玩法真的变了。用户只会为更好的大模型更先进的技术付费，而不是被迫follow某种精心设计的商业模式、屈从于产品惯性。如今商业模式创新可能远远不及技术创新，那一套等着别人试错然后复制，再用泼天流量浇灌的“后发制人”，屡试不爽的套路可能面临失效。Scaling Law强调数据、模型（参数）规模、计算算力。算力卡有钱就行，可以量大管饱，但有钱并不能买来第一梯队的模型。谁有更好的基模，谁有更多的高质量数据，谁才能在大模型时代上牌桌。未来更多行业的入场券可能会变成基模和数据飞轮，并且越早入局越好。更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App