【摘要】TLDR:用 A/B 盲测和独立评估,让约束迭代可验证 问题 约束迭代最大的问题,是写了不代表有效。很多时候我们只是觉得 Agent 变好了,但缺少稳定的验证方法 做法 我的流程分为四步: 修改约束文档,形成改后版本 按官方最佳实践 review,先排除明显不合理的写法 派 Subagent 做 A 阅读全文