Documentation Index
Fetch the complete documentation index at: https://docs.kodus.io/llms.txt
Use this file to discover all available pages before exploring further.
Moonshot 工作原理
Moonshot AI 发布 Kimi 系列模型(K2、K2.5、K2.6、K2.6 Coding)。Kimi 在长上下文代码理解和 Agent 型任务上表现尤为突出,其 API 完全兼容 OpenAI — Kodus 通过OpenAI Compatible 提供商与之对接(或直接使用 BYOK 中精选的 Kimi K2.6 Coding 卡片)。
Moonshot 为同一模型系列提供两条路径,各自有独立端点:
- 开发者 API(
platform.moonshot.ai)— 按 token 付费,按用量计费。并发随充值档位伸缩。 - Kimi Code Plan(
kimi.com/code)— 带专用编码端点的订阅。统一定价,并发被封顶(30 并发)。
Moonshot 的消费者 Kimi.com 聊天订阅(Andante、Moderato 等)与上述两条 API 路径均无关。聊天订阅不授予 API 访问权限。Kimi Code Plan 才是针对 API 的订阅。
platform.moonshot.cn,基础 URL 为 https://api.moonshot.cn/v1),以人民币计费。仅当您在中国大陆运营时使用。
方案概览
Kimi Code Plan(订阅)
| 属性 | 值 |
|---|---|
| 端点 | https://api.kimi.com/coding/v1 |
| 并发 | 上限 30 个并发请求 |
| 计费 | 统一月费订阅 |
| 密钥来源 | kimi.com/code |
开发者 API(按 token 付费)
| 模型 | 价格(每 100 万 输入 / 输出 token) | 上下文窗口 | 说明 |
|---|---|---|---|
Kimi K2.6 Coding 推荐 | 约 2.50 | 约 256k tokens | 最新版,针对代码审查调优。 |
| Kimi K2.5 | 2.50 | 约 256k tokens | 上一代,仍有很强能力。 |
| Kimi K2 (0905) | 更低价格档位 | 约 128k tokens | 稳定的通用模型。 |
https://api.moonshot.ai/v1(国际版)。并发随充值档位伸缩 — Tier 1($10 充值)起始约 50 并发,Tier 5 最多约 1000 并发。
创建 API 密钥
- Kimi Code Plan 订阅者
- 开发者 API(按 token 付费)
- 访问 kimi.com/code 并订阅该方案。
- 打开订阅的密钥管理区域。
- 创建 Kimi Code 密钥并复制。
Kimi Code 密钥仅适用于
https://api.kimi.com/coding/v1。发送到 api.moonshot.ai 会返回 401。在 Kodus 中配置 Moonshot
主流程是在 Kodus Cloud 上使用 BYOK — 精选的 Kimi K2.6 Coding 卡片会为您处理端点切换。希望在进程层级固定提供商的自托管用户可以改用环境变量。方式 1 — Kodus Cloud 上的 BYOK(推荐)
打开 BYOK 并选择 Kimi K2.6 Coding
访问 app.kodus.io/organization/byok,在主模型部分点击 Kimi K2.6 Coding 卡片。
选择您的方案
卡片会展开一个 Plan 选择器。请选择:
- Developer API — 如果您的密钥来自 platform.moonshot.ai
- Kimi Code Plan — 如果您的密钥来自 kimi.com/code 订阅
调优推理(可选)
Kimi K2.6 Coding 默认开启推理 — 精选卡片预填 Thinking: Medium,对于 OpenAI 兼容的提供商会发出thinking: { type: "enabled" }。两种常见覆盖:
-
禁用 thinking,在小型 PR 上实现更快/更便宜的审查:
-
强制特定 token 预算(如果 Moonshot 在您的档位支持
budget_tokens):
无需命名空间包装 — Kodus 在发送前会在
openaiCompatible(当前提供商)下自动包装。详见 主 BYOK 文档 → 自定义 JSON 覆盖。调优并发
- Kimi Code Plan:保留预填的
maxConcurrentRequests=30(文档上限)。更高会返回 429。 - 开发者 API:保持为空(无上限)。实际限制随充值档位伸缩 — Tier 1(约 3000)允许约 1000。如果审查时看到 429,请显式下调。
将 Kimi 配置为 Main,同时保留一个 OpenAI 或 Anthropic 密钥作为 Fallback — 如果 Moonshot 返回 429 或 402,Kodus 会自动故障转移。
方式 2 — 手动配置
如果您需要精选目录中没有的 Kimi 变体(例如kimi-k2.5 或 kimi-k2-0905),请点击目录底部的手动配置并填写:
| 字段 | 值 |
|---|---|
| Provider | OpenAI Compatible |
| Base URL | https://api.moonshot.ai/v1(开发者 API)https://api.kimi.com/coding/v1(Kimi Code Plan)https://api.moonshot.cn/v1(仅限中国大陆) |
| Model | kimi-k2.6、kimi-k2.6、kimi-k2.5、kimi-k2-0905、kimi-k2 |
| API Key | 您的 Moonshot 或 Kimi Code 密钥(与上述基础 URL 匹配) |
| Max Concurrent Requests | Kimi Code Plan 上为 30;开发者 API 保持为空(随充值档位伸缩) |
方式 3 — 自托管(环境变量)
如果您以 Fixed Mode 运行 Kodus(单一全局提供商,无按组织 BYOK),在 API + worker 容器的.env 中配置 Moonshot:
仅在有意禁用 BYOK 的自托管 Kodus 安装中才需要这条路径。如果您的自托管实例启用了 BYOK,请优先使用方式 1 — 精选卡片会为您处理端点逻辑。
.env 后重启 API 和 worker 容器,然后验证集成:
在 Kimi Code Plan、开发者 API 和聚合器之间选择
- Kimi Code Plan — 可预测的统一月费、30 并发上限、专为编码工作流优化的专用
api.kimi.com/coding/v1端点。适合 PR 流量稳定、团队常态化运行的场景。 - Moonshot 开发者 API — 按 token 付费,并发随充值档位伸缩,灵活度最高。适合波动性负载。
- OpenRouter 代理 — 如果您希望多个提供商统一结算,OpenRouter 以少量路由加价暴露 Kimi 模型。当 Kimi 是混合提供商矩阵中的一员、而不是主要工作负载时选择它。
故障排查
Test 后 401 — 密钥与端点不匹配
Test 后 401 — 密钥与端点不匹配
- Kimi Code Plan 密钥仅在
api.kimi.com/coding/v1上工作。 - 来自
platform.moonshot.ai的开发者 API 密钥仅在api.moonshot.ai/v1上工作。 - 来自
platform.moonshot.cn的开发者 API 密钥仅在api.moonshot.cn/v1上工作。 - 在精选卡片中,确认 Plan 选择器与密钥来源匹配。
余额不足
余额不足
- 开发者 API 按 token 付费。余额耗尽时请求返回 HTTP 402。
- 在控制台的账单页面充值,或设置月度上限以避免超支。
- Kimi Code Plan 虽然是统一定价,但受 30 并发上限和配额窗口约束 — 429 意味着您撞到了其中之一。
模型未找到
模型未找到
- 确认模型名称与目录匹配(
kimi-k2.6、kimi-k2.6、kimi-k2.5、kimi-k2-0905、kimi-k2)。 - 请查看 platform.kimi.ai/docs 了解当前列表 — 新版本发布频繁。
首次响应慢
首次响应慢
- 一段时间闲置后的首次调用可能在 Moonshot 侧冷启动。
- 如果延迟重要,
kimi-k2-0905在常规审查上通常比 K2.6 变体更快。
区域 / 连接性
区域 / 连接性
- 中国大陆以外的用户应始终使用
api.moonshot.ai或api.kimi.com。从大陆以外访问api.moonshot.cn可能不通或被限速。 - 确认您的 Kodus 部署允许对所选端点的出站 HTTPS。