我让 Claude 和 Codex 同时审计 26 个模块，它们只在 10 个上达成共识 - 海滨code

Wait 5 sec.

【摘要】用 Claude Opus 4.6 和 GPT-5.3-Codex 对同一个 C++ 遗产项目做独立审计，26 个模块一致率仅 38.5%。Claude 偏向"功能覆盖度"（13 个核心基石），Codex 偏向"实现质量"（只认 2 个），且独立发现了 13 个 Claude 完全漏掉的 Bug。结... 阅读全文