模型定价
闪电API采用按量计费模式,根据实际使用的token数量收费。不同模型和分组有不同的价格,你可以根据需求选择合适的配置。
计费说明
什么是Token?
Token是AI模型处理文本的基本单位。简单来说:
- 1个英文单词 ≈ 1-2个tokens
- 1个中文字符 ≈ 1.5-2个tokens
- 1000个tokens ≈ 750个英文单词或500个中文字
如何计费?
费用 = (输入tokens × 输入价格 + 输出tokens × 输出价格) × 分组倍率
示例:
- 输入:500 tokens
- 输出:300 tokens
- 模型:Claude-xx(输入$1.75/M,输出$14/M)
- 分组:高质量逆向(0.6倍率)
- 费用:(500 × 1.75 + 300 × 14) / 1,000,000 × 0.6 = $0.00306
分组说明
闪电API提供多种令牌分组,每种分组有不同的特性和计费倍率:
| 分组名称 | 倍率 | 特性说明 |
|---|---|---|
| CC专用 | 1.3x | MAX号池,限CC使用,支持1M上下文+高缓存 |
| 高质量逆向 | 0.6x | KiroPro账号逆向,高缓存命中 |
| 低质量逆向 | 0.08x | Kiro普通账号逆向,无缓存命中 |
| Codex | 0.2x | Team账号池,必须流式返回,在Codex内使用 |
| Gemini | 1.0x | gemini-cli/对话均可使用 |
分组选择建议
- 追求质量:选择CC专用或高质量逆向
- 成本优先:选择低质量逆向或Codex
- 特定工具:Codex分组仅限Codex工具使用
- Gemini模型:必须使用Gemini分组
模型定价
最新价格请查看:官网模型广场
具体的价格信息请访问官网模型广场查看最新定价。
节省成本的技巧
1. 选择合适的分组
- 开发测试:使用低质量逆向分组
- 生产环境:使用高质量逆向或CC专用
- Codex工具:必须使用Codex分组
2. 选择合适的模型
- 简单任务:haiku、flash、mini系列
- 复杂任务:sonnet、标准版本
- 最高质量:opus、xhigh系列
3. 优化使用方式
python
# 控制输出长度
max_tokens=500 # 简短回答
# 清晰的提示词
prompt = "用Python写快速排序,包含注释" # 具体明确
# GPT模型必须流式
stream=True # GPT系列必需4. 批量处理
将多个任务合并处理,减少API调用次数。
充值与优惠
首充优惠
- 首次充值可享优惠:0.9¥=1$
企业优惠
大量使用可联系客服(QQ:2214419976,微信:coecvyy)获取企业折扣。
费用监控
实时查询
控制台提供:
- 当前余额
- 今日/本月消费
- 分组使用统计
- 模型使用分布
预警设置
- 余额预警
- 日消费限额
- 月消费预算
常见问题
Q: 如何选择合适的分组?
A: 根据质量需求和成本预算选择。开发测试用低质量,生产用高质量。
Q: 为什么GPT模型必须流式输出?
A: 这是闪电API的技术要求,确保最佳性能和稳定性。
Q: Codex分组只能在Codex工具中使用吗?
A: Codex分组专为Codex工具优化,在其他场景请开启流式输出模式,否则会报错。
Q: 可以随时更换分组吗?
A: 可以,在创建新的API密钥时选择不同分组。