深色模式
计费怎么看
猫猫琳 的核心计费公式很简单:
text
实际扣费 = 模型官方单价 × 模型组倍率 × 实际 token 用量表格里的价格单位
模型与定价 页面中展示的是美元 / 100 万 tokens。
例如:
| 模型 | 输入 | 输出 | 含义 |
|---|---|---|---|
claude-sonnet-4-6 | $3 | $15 | 输入 100 万 tokens 约 $3,输出 100 万 tokens 约 $15 |
gpt-5.5 | $5 | $30 | 输入 100 万 tokens 约 $5,输出 100 万 tokens 约 $30 |
gemini-2.5-flash | $0.3 | $2.5 | 输入 100 万 tokens 约 $0.3,输出 100 万 tokens 约 $2.5 |
缓存价格是什么?
部分 Claude / OpenAI / Gemini 模型支持 prompt cache。
- 缓存写入:第一次把长提示词写入缓存时产生的费用。
- 缓存读取:后续复用同一段上下文时产生的费用。
如果客户端或模型不支持缓存,可以忽略这两列。
订阅组额度
订阅组可能配置:
- 日额度
- 周额度
- 月额度
- 只允许某类客户端或模型范围
当请求失败并提示额度、限额或无可用账号时,先检查 Key 所属模型组是否还有可用额度。
如何降低费用?
- 普通聊天优先选择 mini / flash / haiku 类模型。
- 长上下文任务优先选择支持缓存的模型。
- 代码代理任务可以用 Codex / Sonnet / Opus 等强模型,但建议给复杂任务使用。
- 图片生成和多模态模型通常比纯文本模型更贵。