我让 Claude 和 Codex 同时审计 26 个模块,它们只在 10 个上达成共识 - 海滨code

Wait 5 sec.

【摘要】用 Claude Opus 4.6 和 GPT-5.3-Codex 对同一个 C++ 遗产项目做独立审计,26 个模块一致率仅 38.5%。Claude 偏向"功能覆盖度"(13 个核心基石),Codex 偏向"实现质量"(只认 2 个),且独立发现了 13 个 Claude 完全漏掉的 Bug。结... 阅读全文