刚刚！智谱开源3550亿参数GLM-4.5模型，多项性能或超越Kimi K2成全球第三

Wait 5 sec.

国内大模型赛道太“卷”了。Kimi K2、MiniMax M2、阶跃星辰Step-3模型发布不到一个月，这次智谱又要发布最强新模型了。7月28日消息，刚刚，智谱在全球发布新一代旗舰模型GLM-4.5系列，这是专为 AI Agent智能体应用打造的基础模型，采用混合专家（MoE）架构，在推理、代码、智能体综合能力达到开源模型SOTA水平。综合平均分，GLM-4.5 取得了全球模型第三、国产模型第一，开源模型第一，多项评分超越DeepSeek-R1-0528（55.9）和Kimi K2（53.1）等多款模型。此次GLM-4.5系列包括两款产品：总参数量3550亿、激活参数320亿的GLM-4.5，以及1060亿参数的GLM-4.5-Air。目前，GLM-4.5和 GLM-4.5-Air已经全面在Hugging Face与ModelScope魔搭平台同步开源，API已上线智谱开放平台，满血版GLM-4.5已经可以在智谱清言、z.ai官网免费体验。智谱CEO张鹏早前对笔者表示，智谱依然坚持在做行业Agent产品和解决方案，以及向企业提供MaaS服务。同时，AGI需模型能力的全面性，人类处理复杂任务时，会面对多模态与复杂交互情况，如同木桶不能有短板，对能力需求是全面性的。“不可否认的是，当下AGI之路还刚刚开始，（当前）模型的能力还无法达到完全类比人的这样一个水平。”张鹏曾坦言。智谱GLM-4.5评测数据信息据悉，智谱成立于2019年，以“让机器像人一样思考”为愿景，研发了具有国产独立知识产权的GLM大模型预训练架构。自2023年3月智谱 AI 推出千亿开源基座对话模型ChatGLM系列以来，GLM大模型经历四个大版本迭代，共发布了超过20款 AI 模型技术和产品。商业化方面，截至2023年底，智谱已拥有超2000家生态合作伙伴、超1000个大模型规模化应用，另有200多家企业跟智谱AI进行了深度共创，智谱GLM系列大模型已在金融、医疗、教育等多个行业得到广泛应用；C端层面，截至2024年底，智谱清言拥有超过2500万用户，开始上线付费功能，ARR（年度经常性收入）收入超千万元。融资方面，今年7月，在冲击IPO上市关口，智谱宣布获得上海国资10亿元战略融资；在此之前，智谱获得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计，截至目前，智谱累计融资超百亿元，投后估值超过200亿元，投资方包括高瓴、启明创投、君联资本等知名投资机构，以及美团、阿里、腾讯、小米在内的互联网公司。智谱曾表示，2025年将是智谱的开源年，其将很快发布包括基座模型、推理模型、多模态模型、Agent等在内的全新大模型，并将其开源。如今，智谱终于实现开源最强模型这一目标，这得益于GLM模型的更高参数效率和强化训练流程等多种技术能力。首先，据介绍，而GLM-4.5和GLM-4.5-Air使用了相似的训练流程，首先在 15 万亿token的通用数据上进行了预训练，此后在代码、推理、智能体等领域的8万亿token数据上进行针对性训练，最后通过强化学习进一步增强模型推理、代码与智能体能力。其次，GLM-4.5参数量仅为DeepSeek-R1的50%、Kimi-K2的三分之一，但在多项标准基准测试中表现得更为出色。而且，API价格仅为Claude的1/10，低至输入每百万tokens达0.8元，输出每百万tokens达2元。同时，高速版本实测生成速度超过 100 tokens/秒，支持低延迟、高并发的实际部署需求，兼顾成本效益与交互体验。最后，评测层面，GLM-4.5分为基准和真实场景表现。其中，在包括 MMLU Pro等12个评测基准中，GLM-4.5取得了优异成绩，全球模型第一是OpenAI o3（65.0）、第二是xAI Grok 4（63.6）、第三是GLM-4.5（63.2），超越了Kimi K2（53.1）、DeepSeek R1（55.9）；真实评测方面，采用52个编程开发任务当中，GLM-4.5相对其他开源模型展现出竞争优势，虽然略逊于Claude-4-Sonnet，但在工具调用可靠性和任务完成度方面表现突出，大部分场景中可实现平替效果，编写较为复杂的应用、游戏、交互网页等。目前，GLM-4.5已经对外开源。智谱称，公司后续会发布更加详细的技术报告。事实上，除了智谱GLM-4.5之外，今晚阿里又发布了新的开源模型——电影级视频生成模型通义万相Wan2.2，可将光影、色彩、镜头语言三大电影美学元素装进模型，随意组合60多个直观可控的参数，大幅提升电影级画面的制作效率；而上周，阿里AI三连发——Qwen 3最新版基础模型（非思考版）、Qwen 3推理模型和AI编程模型Qwen3-Coder，它们分别在基础模型、推理模型和编程模型等主流领域获得全球开源冠军；阶跃星辰则在WAIC期间发布Step 3模型，是公司首个全尺寸、原生多模态推理模型，兼顾模型效果与推理成本，采用 MoE 架构，总参数量3210亿，激活参数量380亿。据悉，OpenAI也即将释放最强闭源模型GPT-5，预计最快在7月底发布，有望支持Sora 2世界模型，从而实现多模理解一体化。一位AI行业人士7月28日向笔者表示，随着中国大模型越来越开源，硅谷模型转向闭源，而国内模型的开源对于AI行业有更多的益处。这也意味着，全球基础大模型行业有望迎来新的“洗牌”。（本文首发于钛媒体App，作者｜林志佳，编辑｜盖虹达）更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App