Skip to content

计费怎么看

猫猫琳 的核心计费公式很简单:

text
实际扣费 = 模型官方单价 × 模型组倍率 × 实际 token 用量

表格里的价格单位

模型与定价 页面中展示的是美元 / 100 万 tokens。

例如:

模型输入输出含义
claude-sonnet-4-6$3$15输入 100 万 tokens 约 $3,输出 100 万 tokens 约 $15
gpt-5.5$5$30输入 100 万 tokens 约 $5,输出 100 万 tokens 约 $30
gemini-2.5-flash$0.3$2.5输入 100 万 tokens 约 $0.3,输出 100 万 tokens 约 $2.5

缓存价格是什么?

部分 Claude / OpenAI / Gemini 模型支持 prompt cache。

  • 缓存写入:第一次把长提示词写入缓存时产生的费用。
  • 缓存读取:后续复用同一段上下文时产生的费用。

如果客户端或模型不支持缓存,可以忽略这两列。

订阅组额度

订阅组可能配置:

  • 日额度
  • 周额度
  • 月额度
  • 只允许某类客户端或模型范围

当请求失败并提示额度、限额或无可用账号时,先检查 Key 所属模型组是否还有可用额度。

如何降低费用?

  • 普通聊天优先选择 mini / flash / haiku 类模型。
  • 长上下文任务优先选择支持缓存的模型。
  • 代码代理任务可以用 Codex / Sonnet / Opus 等强模型,但建议给复杂任务使用。
  • 图片生成和多模态模型通常比纯文本模型更贵。