文|光锥智能,作者|白鸽 ,编辑|王一粟这个十一黄金周,AI圈真的很热闹。10月1日凌晨,OpenAI深夜炸场,正式官宣新一代AI视频模型Sora 2,并直接上线了一个AI版的“抖音”——一个完全由AI来生成视频的短视频平台。就在Sora 2发布之前,这一轮的大模型发布其实已经卷起来了。黄金周前夕,先是国内大模型公司深度求索宣布推出DeepSeek-V3.2-Exp实验版模型,紧随其后智谱AI正式发布新一代大模型GLM-4.6。中国大模型也引起了图灵奖得主杨立昆的关注。就在9月30日,蚂蚁集团旗下百灵大模型宣布开源其思考模型Ring-1T的预览版Ring-1T-preview,参数量达1000B(1万亿)。“令人印象深刻,祝贺你们的团队。”在百灵最新思考大模型发布后,杨立昆在社交平台上也给中国大模型点了赞。而在大洋彼岸,Claude Sonnet 4.5同期发布。谷歌Gemini 3.0也预计将在10月迎战。显然,全球大模型进入了一个新的井喷期,各家在大模型产品和技术迭代上,都在明显加速。据不完全统计,仅9月全球就有15家主流企业/机构发布了开源大模型,数量较8月激增70%。开源大模型的热潮,也是开发者的盛宴。有开发者都在社交媒体上感慨:一天测了3个模型,还有一个没测试,这还只是周一......在这其中,中国大模型凭借场景化能力,正撕开半壁江山。据光锥智能观察来看,这一波AI大模型的更新,更聚焦在细分场景中,比如智谱最新大模型在编程方面的能力更加突出,蚂蚁的百灵大模型则聚焦在自然语言推理领域。更为重要的一点在于,当OpenAI开始学字节跳动做产品时,大模型市场的游戏规则变了。如果说,2023年讨论大模型参数天花板,那么,2025年,大模型真正的战场则在场景适配与效率革命。从OpenAI的Sora 2到蚂蚁的万亿推理模型,新一轮的大模型“军备竞赛”已然打响,而行业共识则愈发清晰:大模型已从“通用能力比拼”迈入“细分技术突围”的深水区。那么,在这新一轮AI大模型竞赛中,后来者又该如何在开源生态中突围?深度盘点9月大模型,AI大模型“百花齐放”金九银十的月份,各行各业都在持续加码,大模型赛道也同样“卷”的不行。据不完全统计,在刚刚过去的9月,全球数十家企业共计发布了40多款大模型产品,涵盖基础通用大模型、深度思考推理大模型、编程、具身智能、翻译、视频生成等不同细分赛道。(海外开发者统计的部分9月开源模型)具体来看,这些模型有的侧重高效推理,如带“Flash”字样的蚂蚁集团inclusionAI的Ring-flash-linear-2.0、美团LongCat Flash Chat;有的则聚焦多模态能力,如阿里通义Qwen3-VL;也有的针对轻量化/移动端,如Meta AI发布的MobileLLM-R1-950M、蚂蚁Ling-mini-2.0、Ring-mini-2.0等。可以很明显看到,9月份AI大模型“通用能力、专用场景、部署形态”等维度的全面发展,不同厂商、不同技术路线的大模型“百花齐放”,构成了丰富的LLM生态。在这其中,中国大模型产品占据半壁江山,并与海外市场的大模型产品形成了技术分化。具体来看,相比较此前各家关注的参数规模竞赛,现已经让位于效率革命,MoE(混合专家模型)架构成为绝对主流。如蚂蚁百灵大模型最新开源的Ring-1T-preview,其底座Ring-1T是一个拥有万亿参数的深度思考模型,该开源模型延续Ling 2.0高效MoE架构,在20T高质量语料上完成预训练,结合此前公开的棒冰(icepop)方法,在自研高效强化学习系统ASystem(其中AReaL框架已开源)上进行针对推理能力的RLVR训练。有苹果工程师在单个M3 Ultra芯片上运行Ring-1T-preview,量化的效果接近GPT-5,还能直接生成《太空侵略者》小游戏。(苹果工程师量化后部署Ring-1T-preview,游戏模拟效果)这种“大参数储备+小参数激活”的范式,解决了“性能与成本”的核心矛盾,使超大规模模型从实验室走向具体行业场景。从对开发者开放角度来看,海外阵营中,谷歌EmbeddingGemma主打端侧隐私嵌入,Anthropic 开放 Claude Code API,仍停留在工具型开源。但相比较来说,中国大模型产品更注重场景化能力,比如蚂蚁专攻自然语言推理,腾讯突破小语种翻译,形成“场景驱动型开源”。这种差异在落地效果上立竿见影。如快手将Keye-VL 1.5嵌入审核系统,违规识别准确率达98.7%;爱诗科技的AI插画模型对接电商平台,把详情页制作成本降低80%。事实上,中国大模型产品已经在各个细分领域全面开花,比如语音交互中,阶跃星辰Step-Audio 2 mini支持语音直接调用工具,某智能音箱厂商反馈“唤醒准确率提升至99.2%”;蚂蚁健康管家AQ产品识别报告、药盒、皮肤病等医疗图像准确率达90%以上,包括对100多种复杂多页检查报告的识别与解读。在翻译领域,腾讯 Hunyuan-MT-7B 在 30 个语种翻译中夺冠,跨境电商卖家实测“小语种转化率提升27%”;同时,3D生成赛道中,腾讯混元Voyager可实现原生3D重建,游戏公司开发者称 “场景制作周期从 1 周缩至 4 小时”。另外,值得关注的一点是,相比于大模型创业公司的单点输出,聚焦某一个细分行业,中国互联网大厂们正逐渐形成体系化的产品更新,覆盖基础通用大模型、深度思考大模型、编程大模型、多模态大模型、视频生成大模型等多品类大模型产品,典型的产品就是阿里巴巴旗下的通义千问、腾讯的混元大模型、字节跳动的豆包大模型等。而这种生态优势,也正在转化为全球影响力。据Hugging Face最新数据显示,中文开源模型的fork量在9月增长180%。9月Hugging Face榜单显示,阿里通义7款模型占据全球前十开源模型席位,Qwen3-Omni 登顶榜首,标志着中国从“开源参与者”升级为“生态定义者”。(9月28日, Hugging Face 模型榜单)而中国大模型的“技术普惠+商业赋能”的开源模式,正在重塑全球AI产业格局。“2023年我们追着OpenAI跑,2025年在金融推理、中文语音等领域,国外团队开始抄我们的作业。”一位深耕AI的连续创业者的调侃,道出了中国开源的新底气。模型开源竞争激烈,新来者蓄势待发为什么中国大模型能够如此快速实现赶超?这背后离不开开源战略的选择。据《全球大模型开源生态报告》显示,中美开发者贡献占比超四成,尤其是中国厂商非常注重以“开放策略”抢占生态主动权。而就在今年初,始终坚持闭源路线的OpenAI也开始走开源路线。相比较来说,中国最早且始终坚持走开源路线的阿里通义千问,已经在开源生态中占据了领导地位。那么,后来者还有机会吗?9月,蚂蚁集团旗下百灵大模型以平均每4天一款的速度,密集发布了7款大模型:5日推出“端侧双雄”Ling-mini-2.0与Ring-mini-2.0;12日上线MoE架构的Ling-flash-2.0,19日上线Ring-flash-2.0;26日推出2款混合架构推理优化模型Ring-flash-linear-2.0与Ring-mini-linear-2.0;30日以万亿参数的Ring-1T-preview压轴。模型刚发布完,Ring-1T-preview就登上了开源社区Hugging Face模型趋势榜第三,第四名也是蚂蚁inclusionAI社区的Ring-flash-linear-2.0。放眼全球,这个月只有蚂蚁的开源大模型数量,能比肩阿里通义千问。可以说,蚂蚁已经成为了开源大模型的新晋“搅局者”。从阿里、智谱、蚂蚁等身上也能看到,中国的开源大模型尤其擅长“组合拳”——“全类型覆盖、全尺寸适配、全链条开源”。这种模型版图早已突破语言模型的单一维度,构建起“基础通用+垂直专业”的完整矩阵:以蚂蚁为例,在语言和推理上,Ling系列作为基座模型,通MoE架构优化实现“思考效率跃升”。最新Ling-flash-2.0在AIME数学竞赛、CodeForces编程任务中超越GPT-OSS-120B等大模型,尤其在前端研发场景,经WeaveFox团队联合优化后,能同时满足UI布局功能性与美学需求。而Ring-1T-preview更将推理精度推至新高度,92.6分的AIME成绩仅比GPT-5低2分。多模态深度融合能力上,Ming-lite-omni系列实现“能看、能听、能说、能画”的全感官交互,发布一周内就被社区贡献出消费级显卡可运行的量化版本,其1.5版一度登顶Hugging Face趋势榜榜首。其创新的视觉增强奖励(VAR)机制,解决前端开发中“功能与美学脱节”的行业痛点。而在垂直场景中,依托蚂蚁在金融、医疗领域的场景积累,模型在专业数据上完成针对性训练。例如医疗模型通过结构化病历语料优化,民生服务场景模型已支撑社保查询、政务办理等实际应用。显然,这种布局跳出了“为技术而技术”的陷阱,每个模型都锚定明确的产业价值。另外,在参数膨胀与落地难的矛盾中,蚂蚁走出了一条“全尺寸弹性适配” 的差异化路径,实现从消费级设备到云端算力的无缝覆盖。如Ling-mini-2.0以1B以下激活参数实现苹果设备本地运行,响应速度较同类模型提升2倍,可解决隐私敏感场景下的“云端依赖症”。开发者可直接部署轻量化问答、本地翻译等应用。其Ling-flash-2.0仅激活6.1B参数,却能达到40B Dense模型的效果,在H20平台实现200+tokens/s的生成速度,部署成本降低60%以上。这种 “以小博大”的能力,让中小企业无需重金算力即可享受大模型红利。而Ming-lite-omni 1.5在保持文本、图像、语音融合能力的同时,通过INT8量化技术适配消费级显卡,成为短视频创作、智能硬件交互等场景的首选开源方案。更为重要的是,其Ring-1T-preview的开源打破了万亿参数模型的闭源现状,其基于Ling-2.0 MoE架构和20T语料训练的技术底座,让全球开发者首次能接触到顶尖推理能力的模型权重。从“口袋里的AI” 到“云端超脑”,蚂蚁用四级尺寸矩阵,覆盖了从个人开发者到企业级用户的全场景需求,这正是其开源生态快速起量的关键。蚂蚁在大模型赛道异军突起并非偶然,一方面其能够快速把握行业发展趋势,让大模型的迭代不再陷入参数竞赛,而是敢于攻克“难而正确的事”。深扒蚂蚁发起的inclusionAI社区就会发现,他们毫不吝啬的分享了很多在AI技术上的关键技术思考和进展。比如,蚂蚁发现了“编辑式图像分割”这个技术,对于多模态模型的生成和理解的统一有着非常好的作用,堪比关键的“催化剂”,立马就发文分享给所有开发者。另一方面,当前大模型开源已经进入全栈竞争时代,单纯开放模型权重已无法形成壁垒,蚂蚁通过ATorch框架、数据标准、强化学习工具的协同开源,构建了“接入-训练-部署”的闭环生态,这有可能成为未来开源竞争的核心护城河。中国厂商的全维度开源,正吸引全球开发者向中文生态聚集。开源模式将加速模型的迭代,中国大模型产业或将走出一条“生态换市场、开放换速度”的崛起之路。场景里的AGI,中国走在前面闭源模型更多承担“技术标杆”角色,但开源模型已成为产业落地的核心载体。中国大模型生态正凭借对产业的深度理解和扎根具体场景化的能力,正走在全球AI产业的前列。在这个AI黄金周,我们看到的不仅是技术突破,更是一种全新的发展逻辑:不追求“全能冠军”,而是争当“单项尖兵”;不止步于模型开源,更聚焦于生态落地。当全球都在学习“场景化思维”,中国团队早已手握先发优势。这或许就是国产大模型“不止半壁江山”的真正密码:AGI从不是遥不可及的神话,而是在企业AI数字员工扎根业务场景,AI智能客服更具备个性化能力,借助AI人人都可以进行编程等场景中,被无数个具体的技术突破汇聚而成的浪潮。而这股浪潮,正从中国驶向全球。更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App