B端Ai工具应用从工作流到智能体

Wait 5 sec.

当AI从“工具”走向“智能体”,B端应用正经历一场从流程驱动到决策自治的范式转变。本文不仅拆解了AI工作流的落地逻辑与准确率挑战,更试图回答一个关键问题:企业如何在复杂环境中构建具备自我学习与稳定执行能力的智能系统?Ai机器人发起的几乎以为是真人的语音通话、专业文档或会议文档Ai自动生成、医学领域Ai助手辅助诊断、游戏NPC虚拟玩家、具身机器人的决策系统、Ai coding/自动化测试、金融领域自动生成的实时金融市场报告等;传统行业如海天味业“坚持古法酿造,传承百年精髓”,通过Ai加持把人脸识别技术应用到黄豆的检测中,做出Ai豆脸识别来识别出优质的黄豆。B端工具领域如Salesforce Agent、Shopify把智能体技术赋能给平台商家,如:Agentforce-用户订单咨询案例之一Shopify-智能体体验一方面,我们可以看到Ai正在融入企业生产一线,成为新的生产力,开始感知环境、自主的规划、分析、开始动手做事的Agentic Ai,但是另一方面企业对此的热情和落地深层焦虑并存,对这个事物需要更多的了解。这篇文章希望能为读者缓解这方面的焦虑、对此有更多的了解以及讨论如何建设更高准确率的智能体的一些作为,最后格物致知。Ai工作流Ai工作流是以LLM落地到生产中成本较低、执行较为稳定的流程,通过预定义代码路径协调 LLM 和工具的系统,根据前置条件,按照预设好的工作流顺序进行执行,把大模型的能力转化为生产力落地到生产一线。工作流一般都是面向预设好的范围和系统边界,针对垂类场景调用LLM、多任务编排来完成这条线的目标,其重点有2个:执行准确率、任务编排。任务编排一般可以通过工程方法和领域模型得到合理的设计。本文想主要讨论,面对LLM的不确定性,我们如何保证执行任务的准确率,因为在企业生产一线【准确率】是个非常重要的指标,准确率不解决这个流程基本无法上线,我们一般都要经过:历史数据Ai测试、正式数据Ai离线试跑、Ai辅助人执行、Ai完全自动执行这几个阶段,只有准确率达到了设计的门槛,保持稳定输出且有充分的监控和兜底机制,才能正式投入生产。上线流程执行准确率的关键在于提升LLM的输出准确率,我们的思路是:构建一个增强型的LLM;设计合适的工作流:使得多个职能的LLM分工协作进行产出,既分担处理压力,也在内部建立质检、评估流程,只有满足多重校验规则才会输出。首先想要说明的是复杂性并非我们的追求,并非在于构建最复杂的系统,而是在于构建符合自身需求的系统,从最简单的提示词工程/问题查询改写优化开始,只有在简单的解决方案无法满足需求时,才添加和组合多步骤的Agent或工程方法去完成任务,即系统应尽可能的简洁有效。构建增强型的LLM,之前的文章也介绍过可以用RAG(检索增强生成)、Context Engineering(上下文工程)来完成,所以本文会重点讨论工作流的一些组合方式及应用场景:链式工作流链式工作流链式工作流很适合任务可以清晰地分解为固定子任务的情况,把一个大任务拆分为一步步的分析、检查的子任务,上个LLM的输出作为下一个LLM的输入,通过简化每次 LLM 调用,以降低延迟并控制每一步的质量以提高整体的准确率,如:生成一份会议的总结,并且把文档翻译为英语。这个工作流也可以用于对分析结果的进一步精确,比如第一个LLM处理庞大的数据得到疑似结果,通过第二个LLM调取精准的数据范围对上一步的疑似结果进一步验证,这个方法可以极大的提升输出准确率且控制成本。并行工作流并行工作流我们有时候会遇到一些任务有多个维度都需要进行分析,且分析维度较为独立,把任务拆分为子任务通过不同的大模型单独处理,再对结果进行整合,可以大幅度提升分析速度,且因为拆分后每个大模型承担处理的token数量是减少的,可以更专注于这类的子任务分析,对准确率也是有帮助的,我们也可以针对单独的子流程进行调优;另外并行工作流还有个用法是对同一件事情进行多个视角的分析以获取更高的置信度,通过对多个LLM的多个输出结果进行投票,投票环节也可以加上权重的考虑,以得到最终的的评价结果。分析-校准工作流分析-校准分析-校准工作流适合有明确清晰的评估和校准规则,且对结果的反馈也有助于处理环节的LLM进行改进,让整体工作流既输出合规的结果且在反馈中不断自我学习迭代,让处理环节的LLM越用越聪明,明确的校准规则如一些底线规则,对保障大模型的输出下限是非常重要的。如服务Agent面向用户服务时,必须有足够的护栏或校准机制,确保输出结果的安全性。以上都是目前生成实践中常用的Ai工作流,投入成本相对较低,当需要处理更多复杂性时,工作流也可以为明确的任务支持较为稳定的输出和一致性的结果,工作流承载的是平台已知规则的沉淀,分析效率、安全性、性价比都很不错。AgentAgent的定义各家给的都比较多,本文采纳的是Agent是 LLM作为自主推理决策系统动态指导其自身流程和工具使用的系统,可以控制其如何自动完成任务,来实现大规模灵活性和模型驱动的决策和执行,Agent可以说是是上面增强型LLM、AI工作流且具备自我决策能力的集大成者。LangChain、Ai Agent框架都有助于实现,Agent的用途也非常广泛,用户也可以不一样,成为私人Ai助手、复杂工作流跨系统决策和执行、科学创新、商业决策支持、游戏NPC、人的情感陪伴、机器人的大脑等等,如本文最开始举的Agentforce通过推理引擎自主识别客户意图,调取相关工具,从关联用户信息、查询订单状态、根据状态继续决策如何回复还是继续查询相关政策、最后如何回复客户、内部记录和反馈等全面自动完成,这个Agent为用户提供了全天候的问答服务,在对话中提取客户需求在客户资料中进行标签化,以支持后续的商业营销活动,记录商品供应链或平台的缺陷问题,以支持后续产品迭代;Shopify的智能体可以帮助商家自动准备好产品上架的物料以及可自动完成,还是一位高级分析师,自动分析每日营业情况以及归因和改进点,甚至还是一位情感安慰大师,当我的店铺没有产生任何销售时跟我说这一切都很正常,因为一系列的客观原因。Agent决策-执行LLM输出模块可以做必要的加工,输出可以是数据、音频、文本、图片、操作指令等等以与对象交互,如果Agent需要调用工具,可以设计一个标准化接口,使用 MCP协议或其他方式与工具进行交,上面这个图几乎是个最小的智能体的结构。Agent面向的是开放式环境,环境多变且复杂,决策模块的设计、内部校准和护栏兜底还比较重要,面对复杂任务,也还有一种处理方法:LLM的分工协作对众多无法预测的复杂任务,问题的不同的类别,可以分别处理,可以通过LLM 或更传统的分类模型/算法准确处理分类,对复杂问题的建模和分类几乎是解决问题的前提,面向对象的处理方式始终不过时,多个LLM也可以形成阶梯形的组合,把不同的模型去发挥其所长,模型的能力长处、分析速度、成本考虑等等,可以形成有效的组合,让整体最优。最后最后其实想感谢许多人在Ai上的探索和分享,还有在日常实践中许多人对我的支持和客户的包容。以前有段时间觉得B端产品领域就这样了,Ai的出现发现还有许多未曾到过的世界,希望本文也对你有帮助。本文由@大风吹 原创发布于人人都是产品经理。未经许可,禁止转载。题图来自 Unsplash,基于 CC0 协议提供信息存储空间服务。