GPT 省钱,不是别用最新模型,而是别浪费缓存 - AlfredZhao

Wait 5 sec.

【摘要】很多人一提到“省钱”,第一反应就是别用最新模型。但从一条真实的开发账单看,影响成本的关键,未必只是模型新不新,而是这次请求里有没有把缓存价值吃满。 01 | 先看这笔账到底花在哪 这次小功能开发的 Token 使用为:total=212,930,其中标准输入 189,287,命中缓存 4,328,5 阅读全文