GPT 省钱，不是别用最新模型，而是别浪费缓存 - AlfredZhao

Wait 5 sec.

【摘要】很多人一提到“省钱”，第一反应就是别用最新模型。但从一条真实的开发账单看，影响成本的关键，未必只是模型新不新，而是这次请求里有没有把缓存价值吃满。 01 | 先看这笔账到底花在哪这次小功能开发的 Token 使用为：total=212,930，其中标准输入 189,287，命中缓存 4,328,5 阅读全文