把 Agent 效果从 “感觉” 变成 “可验证” - AaronLin

Wait 5 sec.

【摘要】TLDR：用 A/B 盲测和独立评估，让约束迭代可验证问题约束迭代最大的问题，是写了不代表有效。很多时候我们只是觉得 Agent 变好了，但缺少稳定的验证方法做法我的流程分为四步：修改约束文档，形成改后版本按官方最佳实践 review，先排除明显不合理的写法派 Subagent 做 A 阅读全文