计费怎么看

猫猫琳的核心计费公式很简单：

text

实际扣费 = 模型官方单价 × 模型组倍率 × 实际 token 用量

表格里的价格单位

模型与定价页面中展示的是美元 / 100 万 tokens。

例如：

模型	输入	输出	含义
`claude-sonnet-4-6`	$3	$15	输入 100 万 tokens 约 $3，输出 100 万 tokens 约 $15
`gpt-5.5`	$5	$30	输入 100 万 tokens 约 $5，输出 100 万 tokens 约 $30
`gemini-2.5-flash`	$0.3	$2.5	输入 100 万 tokens 约 $0.3，输出 100 万 tokens 约 $2.5

缓存价格是什么？

部分 Claude / OpenAI / Gemini 模型支持 prompt cache。

缓存写入：第一次把长提示词写入缓存时产生的费用。
缓存读取：后续复用同一段上下文时产生的费用。

如果客户端或模型不支持缓存，可以忽略这两列。

订阅组额度

订阅组可能配置：

日额度
周额度
月额度
只允许某类客户端或模型范围

当请求失败并提示额度、限额或无可用账号时，先检查 Key 所属模型组是否还有可用额度。

如何降低费用？

普通聊天优先选择 mini / flash / haiku 类模型。
长上下文任务优先选择支持缓存的模型。
代码代理任务可以用 Codex / Sonnet / Opus 等强模型，但建议给复杂任务使用。
图片生成和多模态模型通常比纯文本模型更贵。