Skip to content

模型定价

闪电API采用按量计费模式,根据实际使用的token数量收费。不同模型和分组有不同的价格,你可以根据需求选择合适的配置。

计费说明

什么是Token?

Token是AI模型处理文本的基本单位。简单来说:

  • 1个英文单词 ≈ 1-2个tokens
  • 1个中文字符 ≈ 1.5-2个tokens
  • 1000个tokens ≈ 750个英文单词或500个中文字

如何计费?

费用 = (输入tokens × 输入价格 + 输出tokens × 输出价格) × 分组倍率

示例

  • 输入:500 tokens
  • 输出:300 tokens
  • 模型:Claude-xx(输入$1.75/M,输出$14/M)
  • 分组:高质量逆向(0.6倍率)
  • 费用:(500 × 1.75 + 300 × 14) / 1,000,000 × 0.6 = $0.00306

分组说明

闪电API提供多种令牌分组,每种分组有不同的特性和计费倍率:

分组名称倍率特性说明
CC专用1.3xMAX号池,限CC使用,支持1M上下文+高缓存
高质量逆向0.6xKiroPro账号逆向,高缓存命中
低质量逆向0.08xKiro普通账号逆向,无缓存命中
Codex0.2xTeam账号池,必须流式返回,在Codex内使用
Gemini1.0xgemini-cli/对话均可使用

分组选择建议

  • 追求质量:选择CC专用或高质量逆向
  • 成本优先:选择低质量逆向或Codex
  • 特定工具:Codex分组仅限Codex工具使用
  • Gemini模型:必须使用Gemini分组

模型定价

最新价格请查看官网模型广场

具体的价格信息请访问官网模型广场查看最新定价。

节省成本的技巧

1. 选择合适的分组

  • 开发测试:使用低质量逆向分组
  • 生产环境:使用高质量逆向或CC专用
  • Codex工具:必须使用Codex分组

2. 选择合适的模型

  • 简单任务:haiku、flash、mini系列
  • 复杂任务:sonnet、标准版本
  • 最高质量:opus、xhigh系列

3. 优化使用方式

python
# 控制输出长度
max_tokens=500  # 简短回答

# 清晰的提示词
prompt = "用Python写快速排序,包含注释"  # 具体明确

# GPT模型必须流式
stream=True  # GPT系列必需

4. 批量处理

将多个任务合并处理,减少API调用次数。

充值与优惠

首充优惠

  • 首次充值可享优惠:0.9¥=1$

企业优惠

大量使用可联系客服(QQ:2214419976,微信:coecvyy)获取企业折扣。

费用监控

实时查询

控制台提供:

  • 当前余额
  • 今日/本月消费
  • 分组使用统计
  • 模型使用分布

预警设置

  • 余额预警
  • 日消费限额
  • 月消费预算

常见问题

Q: 如何选择合适的分组?
A: 根据质量需求和成本预算选择。开发测试用低质量,生产用高质量。

Q: 为什么GPT模型必须流式输出?
A: 这是闪电API的技术要求,确保最佳性能和稳定性。

Q: Codex分组只能在Codex工具中使用吗?
A: Codex分组专为Codex工具优化,在其他场景请开启流式输出模式,否则会报错。

Q: 可以随时更换分组吗?
A: 可以,在创建新的API密钥时选择不同分组。

下一步

闪电API | Flash API - 让全球顶级AI模型触手可达