蚂蚁数科发布金融推理大模型,金融智能体“长跑”提速 | 最前线

Wait 5 sec.

作者 | 王方玉 编辑 | 苏建勋 AI大模型作为新一代人工智能的基石,为金融行业的智能化提供了强大的技术底座,降低了开发和应用的门槛,堪称金融智能化的“新基建”。 7月28日,在世界人工智能大会(WAIC 2025)上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1。 据悉,该模型专为金融业应用打造,在三大主流金融基准测试中均取得最高评分,超越Deepseek等开源通用大模型及金融大模型,在金融专业性、推理能力以及安全合规能力上表现突出。 此外,蚂蚁数科还提供非推理版本的14B与72B参数金融大模型以及基于百灵基础大模型的MOE架构大模型满足金融机构在多样化场景部署的需求。 当前,AI大模型在金融场景中仍然存在大模型的幻觉问题、输出稳定性问题、过程可解释性问题等挑战,专业化的金融推理大模型就成了必然需求。 基于一行业痛点,蚂蚁数科CTO王维告诉36氪,蚂蚁数科的模型产品思路是从水平通用大模型向专业/专用模型演进。“把过去产品所积累对客户、场景以及解决方案的了解,能够更深入吸取,进而实现垂直专用的转变。” 具体来说,在数据层面,蚂蚁数科构建了全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升了模型处理复杂任务的能力。 在训练层面,蚂蚁数科采用了创新的加权训练算法,提高大模型对复杂金融任务的学习效率与性能。在后续业务应用中,可显著减少二次微调的数据需求与算力消耗,降低大模型落地的门槛与成本。 值得一提的是,蚂蚁数科不仅研发行业模型,还布局了从金融行业大模型、AI平台到上层应用的全栈式解决方案。 打个比方,如果说大模型是“大脑”,那么智能体就是将这个“大脑”的认知能力转化为具体金融业务执行力的“身体”和“行动者”。蚂蚁数科发布的金融推理大模型,有助于进一步加速金融智能体的落地应用。 据悉,目前蚂蚁数科已联合金融行业伙伴推出超百个金融智能体解决方案,覆盖银行、证券、保险、通用金融等四大领域,金融机构可以“即插即用”,提升一线员工工作效率超80%。 AI大模型要真正成为驱动业务增长的关键引擎,不仅关乎技术突破,更在于对金融场景的理解与实践。而蚂蚁在后一方面有着长期的实践经验。 蚂蚁数科AI技术负责人章鹏表示,蚂蚁数科站在了AI大模型和金融的交汇点上。蚂蚁集团有很多自有实践的业务场景,AI智能体经过了蚂蚁的亲身实践,同时数科又可以接触到不同类型的金融机构,因而积累了丰富的交叉经验。 不止蚂蚁数科,世界人工智能大会(WAIC 2025)上,科技厂商在金融领域的智能体应用解决方案已遍地开花。从应用场景看,金融智能体也从对客辅助工具的“单点尝试”走向授信决策等核心业务场景,逐步走向规模化应用。 “当前正是AI智能体百花争鸣的时代,AI智能体的发展将是一场长跑。蚂蚁数科想走的路就是在垂直领域里持续奔跑,特别是在金融领域里,把蚂蚁的禀赋更大程度发挥出来。”王维对36氪表示。