当大模型席卷B端,企业才发现“裸泳”——数据孤岛、口径不一、场景割裂,AI根本跑不动。曾被诟病“重而不中用”的中台,因AI对统一知识沉淀与场景入口的刚需,再次升温。文章给出“主数据中台化”最新方法论:标准设计+模型分层,让中台成为AI落地的第一块跳板。最近和圈子里的几个朋友沟通,B端产品领域,特别是数字化领域,我们共同有一个共识,就是发现中台这个前两年爆火的概念,在今年又慢慢地恢复了热度,而且还在坚持更新的B端产品号,也都或多或少的又一次谈到了中台。01 AI化的时候发现全在裸泳为什么会出现这样的变化?作为中台图书的首位作者,在我看来其实是咱们当下新AI浪潮所带来的。等等,你可能会说了AI浪潮和中台有什么关系?事实上这里的关系可大了,现在的这一轮 AI浪潮其实说白了,我们都知道他是基于大模型的一轮发展,如果以现在投产率最高的图文类大模型来看,也就是基于知识与语料所驱动的一轮人类自然语言转换为机器指令的技术革命。而且更重要的是随着大模型这将近两年多的爆发式发展,我们已经到了一个可以利用新技术实现产业大规模应用的状态了,而且已经有了低成本让企业生产专属AI员工的技术— RAG+开源模型(qianwen/deepseek/k2/……)组合。那在这里就存在两个非常大的隐藏条件点:第一个企业是否有足够多的知识可以供AI来进行训练和内容产生?第二个是否有足够多的场景能让AI 触达?这两个东西本质上来说就是要求企业能将内部的数据沉淀下来,成为整个企业数字资产,并且能将企业的各个场景的入口统一化,能统一沉淀小工程能力,并且作为一个新的公共能力,反向接入各个前台终端。看完我说的这句话,大家是不是感觉到非常的亲切?没错,这不就是中台架构从诞生以来就希望能给企业解决的具体问题吗?而之前之所以很多状态建立失败,就是因为没有这么多的数据,必须要沉淀下来和没有这么多场景必须要触达这两个,没有需求,而是创造需求硬上中台而失败的原因但是这次AI 变革不一样了,是一次真正考验一个企业到底有多少家底的时候了!但是就像那句话说的:只有退潮之后,才知道究竟是谁在裸泳。以我上半年走访过几家企业来看,这些企业想上AI的时候,去做企业内部数据盘点的时候,发现企业内部都不算孤岛了,而是独立世界。举例来说:一个业务单元在企业内部能有三到四个版本,甚至连基本的口径一旦出了本业务线就完全不一样了,甚至自相矛盾。而且跨域之间超低复用能力,同样的一个查询接口在不同域要做3遍甚至每个域都去自己爬数据库了。一线业务动作表现拉不回来,功能堆叠造成一线打一线的,后台玩后台的。……这还想训练AI?做梦!02 面向AI时代的中台建设那么说回来在现在为了支持本轮AI革命企业所需要的应该怎么建设呢?在我看来中台发展到现在这么多年,第一步也是短期能看到成绩的中台化是主数据管理体系(MDM)中台化。首先我们要理解,主数据中台化的本质就是数据资产的共享服务平台,而这过程中我们需解决三个核心问题:-打破业务系统壁垒:避免各系统重复定义主数据(如客户数据在CRM、ERP中格式不一);-支撑业务灵活扩展:当新业务(如新增渠道、新产品线)出现时,主数据能快速适配;-提供标准化服务:通过API、数据接口等方式,向前台业务系统输出“即用型”主数据。因此,整个设计需围绕“平台化沉淀+服务化输出”展开。具体来说怎么做呢?我们先看看主数据管理这件事。在主数据管理领域,其实大白话说穿了就是干两件事:标准设计和模型设计。标准设计和模型设计本质就是确保主数据 “一致、准确、可用” 的核心基础。动作大白话梳理内容01 标准定义数据 应该是什么样规则、格式、含义02 模型定义数据 如何被组织和存储结构、关系、载体两者相互支撑,实现标准指导模型落地,模型固化标准执行。接下来我们一个一个看。步骤01:主数据标准设计方法因为主数据标准是跨业务、跨系统的 “数据契约”,所以标准就是为了解决 “术语统一、格式统一、规则统一” 问题。所以核心方法包括以下几种,我们先把刚才的表格做一个更新:动作大白话梳理内容01标准定义数据 应该是什么样规则、格式、含义落地方法01业务场景分析法:从业务需求倒推标准落地方法02合规映射法:锚定法规与行业规范03模型定义数据 如何被组织和存储结构、关系、载体方法01业务场景分析法:从业务需求倒推标准逻辑:主数据的价值在于支撑业务协同,通过明确主数据在各业务场景中的使用方式(谁用、用什么、怎么用),再提炼共性需求作为标准。步骤:梳理主数据涉及的业务场景(如客户主数据涉及销售下单、客服跟进、财务对账);收集各场景对数据的 “必填项、格式、含义” 需求;合并共性需求,解决冲突(如销售要 “客户简称”,财务要 “客户全称”,需同时保留并定义关系)。举例:客户主数据的 “联系方式” 标准业务场景:销售需打电话联系(需手机号),客服需发邮件(需邮箱),财务需寄发票(需固定电话);共性需求:联系方式需 “可验证”(避免无效数据);标准输出:字段定义:手机号(必填,11 位数字,前 3 位符合运营商号段)、邮箱(必填,格式为 “xxx@xxx.xxx”)、固定电话(选填,格式为 “区号 – 号码”,如 010-12345678);验证规则:手机号通过正则表达式校验(^1 [3-9]d {9}$),邮箱通过格式校验(包含 @和.)。方法02合规映射法:锚定法规与行业规范逻辑:因为主数据常涉及敏感信息(如个人信息、企业资质),需符合法律法规(如《个人信息保护法》《数据安全法》)和行业标准(如金融行业的客户身份识别规范),将合规要求转化为数据标准。步骤:识别主数据中的敏感字段(如客户的身份证号、银行卡号);映射法规要求(如 “身份证号需加密存储”“银行卡号需脱敏展示”);制定对应标准(存储格式、脱敏规则、访问权限)。举例:金融行业客户主数据的 “身份证号” 标准合规要求:《个人信息保护法》规定 “敏感个人信息需加密存储,展示时需脱敏”;标准输出:存储格式:采用 AES 加密算法加密后存储,字段类型为 varchar (128)(加密后长度);展示规则:脱敏后显示为 “110********1234”(保留前 3 位和后 4 位);访问控制:仅风控、客服等授权岗位可查看明文(需日志记录)。步骤02:主数据模型设计方法主数据模型是标准的 “物理载体”,需将抽象的标准转化为结构化的数据结构(实体、属性、关系),确保数据在系统中可存储、可关联、可扩展。核心方法包括以下三种:动作大白话梳理内容01标准定义数据应该是什么样规则、格式、含义落地方法01业务场景分析法:从业务需求倒推标准落地方法02合规映射法:锚定法规与行业规范02模型定义数据如何被组织和存储结构、关系、载体落地方法01实体关系分析法:识别核心实体与关联(主数据管理核心方法论)方法01实体关系分析法:识别核心实体与关联逻辑:主数据的核心是 “实体”(如客户、产品)及实体间的 “关系”(如 “客户购买产品”),需先明确实体边界(什么是主数据实体),再梳理实体间的关联规则。步骤:识别核心实体:基于业务场景,筛选 “跨系统共享、长期稳定、影响范围广” 的实体(如客户、产品是主数据,订单是交易数据);定义实体属性:将标准中 “字段规则” 转化为实体的属性(如客户实体的 “手机号” 属性,对应标准中的格式规则);梳理关系:明确实体间的关联(如 “产品” 与 “产品分类” 是 “多对一” 关系,一个分类包含多个产品)。举例:产品主数据模型的实体关系设计核心实体:产品、产品分类、品牌(均为跨系统共享的稳定实体);实体属性(基于标准):产品:产品 ID(符合编码标准:分类码 + 6 位流水号)、产品名称(符合命名标准:品牌名 + 型号)、规格;产品分类:分类 ID、分类名称(如 “家电 – 冰箱”);品牌:品牌 ID、品牌名称(如 “海尔”);关系:产品 → 产品分类:多对一(一个分类包含多个产品);产品 → 品牌:多对一(一个品牌包含多个产品)。到这我们似乎就把工作做完了是不?等等上面只是完成了方案,在具体落地中我们还有很具体的一步。就是模型的映射,这里我们可以采用分层设计法,来实战从概念到物理的渐进落地逻辑:模型设计需兼顾 “业务理解” 和 “技术实现”,通过 “概念模型→逻辑模型→物理模型” 的分层设计,确保业务人员能看懂、技术人员能落地。步骤:概念模型:用业务语言描述实体及关系(如 “客户包含个人客户和企业客户,个人客户有联系人”),不涉及技术细节;逻辑模型:细化实体属性,定义数据类型(不绑定具体数据库),如 “客户 ID(字符串)、姓名(字符串)”;物理模型:针对具体数据库(如 MySQL),定义字段类型(如 varchar (32))所以整个主数据表格我们就得到了完整的如下版图动作大白话梳理内容01标准定义数据 应该是什么样规则、格式、含义落地方法01业务场景分析法:从业务需求倒推标准落地方法02合规映射法:锚定法规与行业规范02 模型定义数据 如何被组织和存储结构、关系、载体落地方法01实体关系分析法:识别核心实体与关联03分层设计法:模型映射落地理解了主数据管理的逻辑后,我们再看中台化的主数据管理。中台的主数据管理的标准设计需兼顾 “全域一致性” 和 “业务域灵活性”,通过 “核心标准层 + 业务域扩展层” 两层架构实现,同时依托中台工具实现标准的全生命周期管理。步骤01:核心标准层:中台统一的 “数据契约”逻辑:提炼各业务域共通的核心字段(如客户的唯一标识、产品的基础属性),形成跨域统一的 “基准标准”,作为中台的 “最小数据集”,确保主数据的全域一致性。中台化方法:·基于 “业务域地图” 梳理共性:通过中台的业务域建模工具(如元数据管理平台),识别客户、产品、组织等主数据在各业务域(销售、供应链、财务)中的共性需求(如 “客户 ID” 必须唯一且跨系统通用);·标准的平台化固化:将核心标准录入中台的 “标准管理中心”,绑定校验规则(如格式、唯一性),并通过中台引擎自动同步至各业务系统(避免人工维护)。举例:客户主数据核心标准(中台统一层)·核心字段(跨域必选):·客户唯一标识(CUST_ID):中台自动生成的全局 ID(规则:前缀 “C”+8 位数字,如 C10000001),通过中台的 ID 生成服务确保唯一性;·客户类型(CUST_TYPE):枚举值(个人 / 企业),由中台标准中心统一定义,不允许业务系统自定义;·状态(STATUS):枚举值(有效 / 无效),状态变更需通过中台的审批流服务触发(如 “无效” 需销售 + 财务双确认)。·中台支撑:核心标准通过中台的 “标准校验 API” 对外提供服务,业务系统录入客户数据时,需调用该 API 校验格式(如 CUST_ID 不符合规则则返回错误)。步骤02:业务域扩展层:中台支撑的 “灵活适配”逻辑:针对各业务域的个性化需求(如销售需要 “客户渠道标签”,客服需要 “客户偏好标签”),在核心标准基础上允许 “域化扩展”,但扩展规则需在中台备案并接受统一管理,避免标准失控。中台化方法:·扩展字段的 “申请 – 审批 – 发布” 流程:业务域通过中台的 “扩展字段管理平台” 提交需求(如销售域需新增 “客户来源渠道” 字段),经中台治理委员会审批后,在核心标准基础上添加扩展字段;·扩展标准的 “继承性约束”:扩展字段需遵循中台的基础规则(如数据类型、脱敏要求),例如 “客户来源渠道” 的可选值(官网 / 线下门店)需在中台登记,确保跨域查询时可识别。举例:客户主数据扩展标准(业务域层)·销售域扩展字段:·客户来源渠道(SOURCE_CHANNEL):值集由销售部门在中台扩展平台申请,经审批后生效(如 “官网”“天猫”“门店”);·跟进销售 ID(SALES_ID):关联中台的 “员工主数据”,通过中台的关联校验服务确保该 ID 在员工主数据中存在;·客服域扩展字段:·客户偏好(PREFERENCE):文本类型(如 “偏好线上沟通”),格式由客服部门定义,但需在中台登记存储规则(如长度≤100 字)。可以看到在中台管理时候,就是将各个域内部对于主数据的工作拉起到一个公共的地方去统一管理,从而将规范在各个域落地推进。03 最后最后我想说,也正如我前几年在我中台产品经理宝典一书中所写到的任何技术没有好与坏,只有企业是否发展到真正需要该技术的时刻,否则用大炮打蚊子的可笑场景永远不会结束!本文由人人都是产品经理作者【三爷茶馆】,微信公众号:【三爷茶馆】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。题图来自Unsplash,基于 CC0 协议。