模型定价

闪电API采用按量计费模式，根据实际使用的token数量收费。不同模型和分组有不同的价格，你可以根据需求选择合适的配置。

计费说明

什么是Token？

Token是AI模型处理文本的基本单位。简单来说：

1个英文单词 ≈ 1-2个tokens
1个中文字符 ≈ 1.5-2个tokens
1000个tokens ≈ 750个英文单词或500个中文字

如何计费？

费用 = (输入tokens × 输入价格 + 输出tokens × 输出价格) × 分组倍率

示例：

输入：500 tokens
输出：300 tokens
模型：Claude-xx（输入$1.75/M，输出$14/M）
分组：高质量逆向（0.6倍率）
费用：(500 × 1.75 + 300 × 14) / 1,000,000 × 0.6 = $0.00306

分组说明

闪电API提供多种令牌分组，每种分组有不同的特性和计费倍率：

分组名称	倍率	特性说明
CC专用	1.3x	MAX号池，限CC使用，支持1M上下文+高缓存
高质量逆向	0.6x	KiroPro账号逆向，高缓存命中
低质量逆向	0.08x	Kiro普通账号逆向，无缓存命中
Codex	0.2x	Team账号池，必须流式返回，在Codex内使用
Gemini	1.0x	gemini-cli/对话均可使用

分组选择建议

追求质量：选择CC专用或高质量逆向
成本优先：选择低质量逆向或Codex
特定工具：Codex分组仅限Codex工具使用
Gemini模型：必须使用Gemini分组

模型定价

最新价格请查看：官网模型广场

具体的价格信息请访问官网模型广场查看最新定价。

节省成本的技巧

1. 选择合适的分组

开发测试：使用低质量逆向分组
生产环境：使用高质量逆向或CC专用
Codex工具：必须使用Codex分组

2. 选择合适的模型

简单任务：haiku、flash、mini系列
复杂任务：sonnet、标准版本
最高质量：opus、xhigh系列

3. 优化使用方式

python

# 控制输出长度
max_tokens=500  # 简短回答

# 清晰的提示词
prompt = "用Python写快速排序，包含注释"  # 具体明确

# GPT模型必须流式
stream=True  # GPT系列必需

4. 批量处理

将多个任务合并处理，减少API调用次数。

充值与优惠

首充优惠

首次充值可享优惠：0.9¥=1$

企业优惠

大量使用可联系客服（QQ：2214419976，微信：coecvyy）获取企业折扣。

费用监控

实时查询

控制台提供：

当前余额
今日/本月消费
分组使用统计
模型使用分布

预警设置

余额预警
日消费限额
月消费预算

常见问题

Q: 如何选择合适的分组？
A: 根据质量需求和成本预算选择。开发测试用低质量，生产用高质量。

Q: 为什么GPT模型必须流式输出？
A: 这是闪电API的技术要求，确保最佳性能和稳定性。

Q: Codex分组只能在Codex工具中使用吗？
A: Codex分组专为Codex工具优化，在其他场景请开启流式输出模式，否则会报错。

Q: 可以随时更换分组吗？
A: 可以，在创建新的API密钥时选择不同分组。

下一步

查看最新价格 - 官网模型广场
创建API密钥 - 选择合适分组
充值账户 - 开始使用
联系客服 - 咨询优惠方案

模型定价 ​

计费说明 ​

什么是Token？ ​

如何计费？ ​

分组说明 ​

分组选择建议 ​

模型定价 ​

节省成本的技巧 ​

1. 选择合适的分组 ​

2. 选择合适的模型 ​

3. 优化使用方式 ​

4. 批量处理 ​

充值与优惠 ​

首充优惠 ​

企业优惠 ​

费用监控 ​

实时查询 ​

预警设置 ​

常见问题 ​

下一步 ​

模型定价

计费说明

什么是Token？

如何计费？

分组说明

分组选择建议

模型定价

节省成本的技巧

1. 选择合适的分组

2. 选择合适的模型

3. 优化使用方式

4. 批量处理

充值与优惠

首充优惠

企业优惠

费用监控

实时查询

预警设置

常见问题

下一步