Moonshot(Kimi)- OpenAI 兼容的推理平台

Moonshot 工作原理

Moonshot AI 发布 Kimi 系列模型(K2、K2.5、K2.6、K2.6 Coding)。Kimi 在长上下文代码理解和 Agent 型任务上表现尤为突出,其 API 完全兼容 OpenAI — Kodus 通过 OpenAI Compatible 提供商与之对接(或直接使用 BYOK 中精选的 Kimi K2.6 Coding 卡片)。 Moonshot 为同一模型系列提供两条路径,各自有独立端点:

开发者 API(platform.moonshot.ai)— 按 token 付费,按用量计费。并发随充值档位伸缩。
Kimi Code Plan(kimi.com/code)— 带专用编码端点的订阅。统一定价,并发被封顶(30 并发)。

Moonshot 的消费者 Kimi.com 聊天订阅(Andante、Moderato 等)与上述两条 API 路径均无关。聊天订阅不授予 API 访问权限。Kimi Code Plan 才是针对 API 的订阅。

Moonshot 还运营一个仅限中国大陆的平台(platform.moonshot.cn,基础 URL 为 https://api.moonshot.cn/v1),以人民币计费。仅当您在中国大陆运营时使用。

方案概览

Kimi Code Plan(订阅)

属性	值
端点	`https://api.kimi.com/coding/v1`
并发	上限 30 个并发请求
计费	统一月费订阅
密钥来源	kimi.com/code

开发者 API(按 token 付费)

模型	价格(每 100 万输入 / 输出 token)	上下文窗口	说明
Kimi K2.6 Coding `推荐`	约 $0.60 /$ 2.50	约 256k tokens	最新版,针对代码审查调优。
Kimi K2.5	$0.60 /$ 2.50	约 256k tokens	上一代,仍有很强能力。
Kimi K2 (0905)	更低价格档位	约 128k tokens	稳定的通用模型。

开发者 API 端点:https://api.moonshot.ai/v1(国际版)。并发随充值档位伸缩 — Tier 1($10 充值)起始约 50 并发,Tier 5 最多约 1000 并发。

创建 API 密钥

创建 API 密钥需要 Moonshot 账号。

Kimi Code Plan 订阅者
开发者 API(按 token 付费)

访问 kimi.com/code 并订阅该方案。
打开订阅的密钥管理区域。
创建 Kimi Code 密钥并复制。

Kimi Code 密钥仅适用于 https://api.kimi.com/coding/v1。发送到 api.moonshot.ai 会返回 401。

在 platform.moonshot.ai 登录(如果您在中国大陆运营,请改用 platform.moonshot.cn)。
添加支付方式 — Moonshot 首次添加账单时可能会赠送少量起始余额。
打开 platform.moonshot.ai/console/api-keys 上的 API Keys 部分。
点击 Create API Key,给它一个描述性的名字(例如 kodus-prod),并立即复制密钥。

开发者 API 密钥仅适用于 api.moonshot.ai/v1(国际版)或 api.moonshot.cn/v1(中国版)。密钥在两个区域之间不可移植。

在 Kodus 中配置 Moonshot

主流程是在 Kodus Cloud 上使用 BYOK — 精选的 Kimi K2.6 Coding 卡片会为您处理端点切换。希望在进程层级固定提供商的自托管用户可以改用环境变量。

方式 1 — Kodus Cloud 上的 BYOK(推荐)

打开 BYOK 并选择 Kimi K2.6 Coding

访问 app.kodus.io/organization/byok,在主模型部分点击 Kimi K2.6 Coding 卡片。

选择您的方案

卡片会展开一个 Plan 选择器。请选择:

Developer API — 如果您的密钥来自 platform.moonshot.ai
Kimi Code Plan — 如果您的密钥来自 kimi.com/code 订阅

基础 URL 和”获取密钥”链接会自动更新。

粘贴您的 API 密钥

只需密钥。对于 Kimi Code Plan 用户,Kodus 会在高级设置中预填 maxConcurrentRequests=30(匹配文档中的上限)。

测试并保存

点击测试并保存。Kodus 会通过一次低成本的元数据调用探测端点,成功后持久化配置。401 表示密钥与所选方案的端点不匹配。

调优推理(可选)

Kimi K2.6 Coding 默认开启推理 — 精选卡片预填 Thinking: Medium,对于 OpenAI 兼容的提供商会发出 thinking: { type: "enabled" }。两种常见覆盖:

禁用 thinking,在小型 PR 上实现更快/更便宜的审查:
{ "thinking": { "type": "disabled" } }
强制特定 token 预算(如果 Moonshot 在您的档位支持 budget_tokens):
{ "thinking": { "type": "enabled", "budget_tokens": 25000 } }

无需命名空间包装 — Kodus 在发送前会在 openaiCompatible(当前提供商)下自动包装。详见主 BYOK 文档 → 自定义 JSON 覆盖。

调优并发

Kimi Code Plan:保留预填的 maxConcurrentRequests=30(文档上限)。更高会返回 429。
开发者 API:保持为空(无上限)。实际限制随充值档位伸缩 — Tier 1(约 $10 充值)允许约 50 并发;Tier 5(约$ 3000)允许约 1000。如果审查时看到 429,请显式下调。

将 Kimi 配置为 Main,同时保留一个 OpenAI 或 Anthropic 密钥作为 Fallback — 如果 Moonshot 返回 429 或 402,Kodus 会自动故障转移。

方式 2 — 手动配置

如果您需要精选目录中没有的 Kimi 变体(例如 kimi-k2.5 或 kimi-k2-0905),请点击目录底部的手动配置并填写:

字段	值
Provider	`OpenAI Compatible`
Base URL	`https://api.moonshot.ai/v1`(开发者 API) `https://api.kimi.com/coding/v1`(Kimi Code Plan) `https://api.moonshot.cn/v1`(仅限中国大陆)
Model	`kimi-k2.6`、`kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905`、`kimi-k2`
API Key	您的 Moonshot 或 Kimi Code 密钥(与上述基础 URL 匹配)
Max Concurrent Requests	Kimi Code Plan 上为 `30`;开发者 API 保持为空(随充值档位伸缩)

方式 3 — 自托管(环境变量)

如果您以 Fixed Mode 运行 Kodus(单一全局提供商,无按组织 BYOK),在 API + worker 容器的 .env 中配置 Moonshot:

# Moonshot(Kimi)配置(固定模式)
API_LLM_PROVIDER_MODEL="kimi-k2.6"
API_OPENAI_FORCE_BASE_URL="https://api.moonshot.ai/v1"    # Kimi Code Plan 使用 https://api.kimi.com/coding/v1
API_OPEN_AI_API_KEY="your-moonshot-or-kimi-code-api-key"

仅在有意禁用 BYOK 的自托管 Kodus 安装中才需要这条路径。如果您的自托管实例启用了 BYOK,请优先使用方式 1 — 精选卡片会为您处理端点逻辑。

编辑 .env 后重启 API 和 worker 容器,然后验证集成:

docker-compose logs api worker | grep -iE "moonshot|kimi"

完整的自托管设置(域名、安全密钥、数据库、webhook、反向代理)请参见通用 VM 部署指南,只需将 LLM 部分替换为上面的配置。

在 Kimi Code Plan、开发者 API 和聚合器之间选择

Kimi Code Plan — 可预测的统一月费、30 并发上限、专为编码工作流优化的专用 api.kimi.com/coding/v1 端点。适合 PR 流量稳定、团队常态化运行的场景。
Moonshot 开发者 API — 按 token 付费,并发随充值档位伸缩,灵活度最高。适合波动性负载。
OpenRouter 代理 — 如果您希望多个提供商统一结算,OpenRouter 以少量路由加价暴露 Kimi 模型。当 Kimi 是混合提供商矩阵中的一员、而不是主要工作负载时选择它。

故障排查

Test 后 401 — 密钥与端点不匹配

Kimi Code Plan 密钥仅在 api.kimi.com/coding/v1 上工作。
来自 platform.moonshot.ai 的开发者 API 密钥仅在 api.moonshot.ai/v1 上工作。
来自 platform.moonshot.cn 的开发者 API 密钥仅在 api.moonshot.cn/v1 上工作。
在精选卡片中,确认 Plan 选择器与密钥来源匹配。

余额不足

开发者 API 按 token 付费。余额耗尽时请求返回 HTTP 402。
在控制台的账单页面充值,或设置月度上限以避免超支。
Kimi Code Plan 虽然是统一定价,但受 30 并发上限和配额窗口约束 — 429 意味着您撞到了其中之一。

模型未找到

确认模型名称与目录匹配(kimi-k2.6、kimi-k2.6、kimi-k2.5、kimi-k2-0905、kimi-k2)。
请查看 platform.kimi.ai/docs 了解当前列表 — 新版本发布频繁。

首次响应慢

一段时间闲置后的首次调用可能在 Moonshot 侧冷启动。
如果延迟重要,kimi-k2-0905 在常规审查上通常比 K2.6 变体更快。

区域 / 连接性

中国大陆以外的用户应始终使用 api.moonshot.ai 或 api.kimi.com。从大陆以外访问 api.moonshot.cn 可能不通或被限速。
确认您的 Kodus 部署允许对所选端点的出站 HTTPS。

概述

代码审查

业务逻辑验证

规则与自动化

设置与集成

故障排除

LLM 提供商

Moonshot(Kimi)- OpenAI 兼容的推理平台

Moonshot 工作原理

方案概览

Kimi Code Plan(订阅)

开发者 API(按 token 付费)

创建 API 密钥

在 Kodus 中配置 Moonshot

方式 1 — Kodus Cloud 上的 BYOK(推荐)

调优推理(可选)

调优并发

方式 2 — 手动配置

方式 3 — 自托管(环境变量)

在 Kimi Code Plan、开发者 API 和聚合器之间选择

故障排查

相关链接

​Moonshot 工作原理

​方案概览

​Kimi Code Plan(订阅)

​开发者 API(按 token 付费)

​创建 API 密钥

​在 Kodus 中配置 Moonshot

​方式 1 — Kodus Cloud 上的 BYOK(推荐)

​调优推理(可选)

​调优并发

​方式 2 — 手动配置

​方式 3 — 自托管(环境变量)

​在 Kimi Code Plan、开发者 API 和聚合器之间选择

​故障排查

​相关链接

Moonshot 工作原理

方案概览

Kimi Code Plan(订阅)

开发者 API(按 token 付费)

创建 API 密钥

在 Kodus 中配置 Moonshot

方式 1 — Kodus Cloud 上的 BYOK(推荐)

调优推理(可选)

调优并发

方式 2 — 手动配置

方式 3 — 自托管(环境变量)

在 Kimi Code Plan、开发者 API 和聚合器之间选择

故障排查

相关链接