【摘要】很多人一提到“省钱”,第一反应就是别用最新模型。但从一条真实的开发账单看,影响成本的关键,未必只是模型新不新,而是这次请求里有没有把缓存价值吃满。 01 | 先看这笔账到底花在哪 这次小功能开发的 Token 使用为:total=212,930,其中标准输入 189,287,命中缓存 4,328,5 阅读全文