刚刚!智谱开源3550亿参数GLM-4.5模型,多项性能或超越Kimi K2成全球第三

Wait 5 sec.

国内大模型赛道太“卷”了。Kimi K2、MiniMax M2、阶跃星辰Step-3模型发布不到一个月,这次智谱又要发布最强新模型了。7月28日消息,刚刚,智谱在全球发布新一代旗舰模型GLM-4.5系列,这是专为 AI Agent智能体应用打造的基础模型,采用混合专家(MoE)架构,在推理、代码、智能体综合能力达到开源模型SOTA水平。综合平均分,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一,多项评分超越DeepSeek-R1-0528(55.9)和Kimi K2(53.1)等多款模型。此次GLM-4.5系列包括两款产品:总参数量3550亿、激活参数320亿的GLM-4.5,以及1060亿参数的GLM-4.5-Air。目前,GLM-4.5和 GLM-4.5-Air已经全面在Hugging Face与ModelScope魔搭平台同步开源,API已上线智谱开放平台,满血版GLM-4.5已经可以在智谱清言、z.ai官网免费体验。智谱CEO张鹏早前对笔者表示,智谱依然坚持在做行业Agent产品和解决方案,以及向企业提供MaaS服务。同时,AGI需模型能力的全面性,人类处理复杂任务时,会面对多模态与复杂交互情况,如同木桶不能有短板,对能力需求是全面性的。“不可否认的是,当下AGI之路还刚刚开始,(当前)模型的能力还无法达到完全类比人的这样一个水平。”张鹏曾坦言。智谱GLM-4.5评测数据信息据悉,智谱成立于2019年,以“让机器像人一样思考”为愿景,研发了具有国产独立知识产权的GLM大模型预训练架构。自2023年3月智谱 AI 推出千亿开源基座对话模型ChatGLM系列以来,GLM大模型经历四个大版本迭代,共发布了超过20款 AI 模型技术和产品。商业化方面,截至2023年底,智谱已拥有超2000家生态合作伙伴、超1000个大模型规模化应用,另有200多家企业跟智谱AI进行了深度共创,智谱GLM系列大模型已在金融、医疗、教育等多个行业得到广泛应用;C端层面,截至2024年底,智谱清言拥有超过2500万用户,开始上线付费功能,ARR(年度经常性收入)收入超千万元。融资方面,今年7月,在冲击IPO上市关口,智谱宣布获得上海国资10亿元战略融资;在此之前,智谱获得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计,截至目前,智谱累计融资超百亿元,投后估值超过200亿元,投资方包括高瓴、启明创投、君联资本等知名投资机构,以及美团、阿里、腾讯、小米在内的互联网公司。智谱曾表示,2025年将是智谱的开源年,其将很快发布包括基座模型、推理模型、多模态模型、Agent等在内的全新大模型,并将其开源。如今,智谱终于实现开源最强模型这一目标,这得益于GLM模型的更高参数效率和强化训练流程等多种技术能力。首先,据介绍,而GLM-4.5和GLM-4.5-Air使用了相似的训练流程,首先在 15 万亿token的通用数据上进行了预训练,此后在代码、推理、智能体等领域的8万亿token数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。其次,GLM-4.5参数量仅为DeepSeek-R1的50%、Kimi-K2的三分之一,但在多项标准基准测试中表现得更为出色。而且,API价格仅为Claude的1/10,低至输入每百万tokens达0.8元,输出每百万tokens达2元。同时,高速版本实测生成速度超过 100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。最后,评测层面,GLM-4.5分为基准和真实场景表现。其中,在包括 MMLU Pro等12个评测基准中,GLM-4.5取得了优异成绩,全球模型第一是OpenAI o3(65.0)、第二是xAI Grok 4(63.6)、第三是GLM-4.5(63.2),超越了Kimi K2(53.1)、DeepSeek R1(55.9);真实评测方面,采用52个编程开发任务当中,GLM-4.5相对其他开源模型展现出竞争优势,虽然略逊于Claude-4-Sonnet,但在工具调用可靠性和任务完成度方面表现突出,大部分场景中可实现平替效果,编写较为复杂的应用、游戏、交互网页等。目前,GLM-4.5已经对外开源。智谱称,公司后续会发布更加详细的技术报告。事实上,除了智谱GLM-4.5之外,今晚阿里又发布了新的开源模型——电影级视频生成模型通义万相Wan2.2,可将光影、色彩、镜头语言三大电影美学元素装进模型,随意组合60多个直观可控的参数,大幅提升电影级画面的制作效率;而上周,阿里AI三连发——Qwen 3最新版基础模型(非思考版)、Qwen 3推理模型和AI编程模型Qwen3-Coder,它们分别在基础模型、推理模型和编程模型等主流领域获得全球开源冠军;阶跃星辰则在WAIC期间发布Step 3模型,是公司首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,采用 MoE 架构,总参数量3210亿,激活参数量380亿。据悉,OpenAI也即将释放最强闭源模型GPT-5,预计最快在7月底发布,有望支持Sora 2世界模型,从而实现多模理解一体化。一位AI行业人士7月28日向笔者表示,随着中国大模型越来越开源,硅谷模型转向闭源,而国内模型的开源对于AI行业有更多的益处。这也意味着,全球基础大模型行业有望迎来新的“洗牌”。(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App