计算公式
总成本 = 输入 token 数 / 1,000,000 * 输入单价
+ 输出 token 数 / 1,000,000 * 输出单价
估算示例
假设一个客服机器人每天 1000 次调用,每次输入 1500 token,输出 500 token:
每日输入 token = 1000 * 1500 = 1,500,000
每日输出 token = 1000 * 500 = 500,000
月度成本 = 每日成本 * 30
如何降低 AI API 成本
- 压缩 system prompt,避免每次请求重复塞入长规则。
- 把简单分类、改写任务交给低价模型。
- 知识库问答减少召回片段数量,只保留真正相关内容。
- 开启缓存,对重复问题直接返回历史答案。
- 流式输出时在答案足够后主动停止,减少输出 token。
下一步
注册后可以在控制台查看模型实时价格和账单流水。建议先用真实业务样本跑 50-100 次调用,再估算月度预算。