Skip to content

Claude Code Hub 使用指南

Claude Code Hub(CCH)不是单机客户端,而是团队用的中间层。它把多个上游 AI 服务统一接进来,再向 Claude Code、Codex、Gemini CLI 等客户端提供一个可观测、可限流、可故障转移的入口。

如果你只是个人开发者,本页很可能不是你的第一选择;如果你在维护一个团队、多租户或共享额度环境,这页才有意义。

适合谁

  • 多人共用 AI 编程工具
  • 想统一管理上游 provider、用户、API Key 和成本
  • 需要负载均衡、熔断、限流、监控和审计

官方定位

根据 claude-code-hub.app 官方文档,CCH 的核心能力包括:

  • 多供应商统一接入
  • 智能负载均衡
  • 自动故障转移
  • Session 粘性
  • 成本与限流控制
  • 实时监控和统计
  • OpenAI 兼容层

更适合什么场景

个人用户不适合直接上来就部署

如果你只是一个人用 AI CLI,直接配置 Claude Code、Codex、OpenCode 往往更简单。

团队共享时价值才会明显

当你开始面对下面这些问题时,CCH 才真正有必要:

  • 多个人都要用同一批上游服务
  • 需要统一分配或回收 Key
  • 希望服务故障时自动切换
  • 需要看每个人、每个 key、每个模型的成本

部署建议

推荐环境:Linux 服务器

官方文档虽然提供多种部署方式,但从角色定位看,CCH 更适合部署在长期在线的 Linux 主机或容器环境中。

先满足三个前提

  1. CCH 服务本身已经成功启动
  2. 后台里已经创建用户和 API Key
  3. 至少已经配置一个上游 provider

如果这三步没完成,就不要急着接客户端。

客户端接入思路

官方文档已经把 Claude Code、Codex、Gemini CLI 等客户端接入单独拆成章节。你可以把 CCH 理解为:

text
客户端 -> Claude Code Hub -> 上游模型服务

所以真正的配置顺序应该是:

  1. 先把 CCH 部署起来
  2. 再在 CCH 中添加 provider
  3. 再创建用户和 Key
  4. 最后让客户端统一改连 CCH

接入 Flash API

适合,而且这恰好是它的典型场景之一。

如果你希望团队统一走 Flash API,CCH 的思路通常是:

  1. 在 CCH 后台添加一个新的 upstream provider
  2. Base URL 指向 https://ai.flashapi.tophttps://ai.flashapi.top/v1
  3. 填入 Flash API Key
  4. 在 provider 中登记你准备开放给团队的模型
  5. 给开发者分配 CCH 自己生成的访问 Key
  6. 让客户端统一改连 CCH,而不是每个人都直连 Flash API

这样做的好处是:

  • 可以统一限流
  • 可以按团队、项目做成本统计
  • 上游变更时不需要每个人都改本地配置

如果你只有少量用户,直连 Flash API 更简单;如果你有多人、多项目、多上游,CCH 更适合作为第二层。

你应该重点关注哪些功能

Session 粘性

这对编码类 agent 很重要。因为同一会话如果频繁切 provider,不仅体验会漂,缓存命中率和成本也会变差。

熔断与自动切换

如果你的上游不止一家,这会是 CCH 的核心价值之一。

监控和统计

如果团队已经开始真用 AI 工具,最终都会回到两个问题:

  • 谁在用
  • 用了多少

CCH 的监控页就是为这个准备的。

不适合的情况

  • 只有一个人偶尔本地用
  • 没有持续在线服务器
  • 没有统一管理需求
  • 只是想快速试试模型

这些场景直接用客户端更省事。

官方链接

闪电API | Flash API - 让全球顶级AI模型触手可达