【摘要】去年面字节的时候,面试官问我:“你们项目里的知识库问答是怎么做的?” 我说:“直接调 OpenAI 的 API,把文档塞进去让模型自己读。” 空气突然安静了三秒。我看到面试官的眉头皱了一下,才意识到事情不对——当时我们项目的文档有 20 多万字,每次请求都超 Token 上限,而且模型根本记不住上周 阅读全文