跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.kodus.io/llms.txt

Use this file to discover all available pages before exploring further.

Moonshot 工作原理

Moonshot AI 发布 Kimi 系列模型(K2、K2.5、K2.6、K2.6 Coding)。Kimi 在长上下文代码理解和 Agent 型任务上表现尤为突出,其 API 完全兼容 OpenAI — Kodus 通过 OpenAI Compatible 提供商与之对接(或直接使用 BYOK 中精选的 Kimi K2.6 Coding 卡片)。 Moonshot 为同一模型系列提供两条路径,各自有独立端点:
  • 开发者 API(platform.moonshot.ai)— 按 token 付费,按用量计费。并发随充值档位伸缩。
  • Kimi Code Plan(kimi.com/code)— 带专用编码端点的订阅。统一定价,并发被封顶(30 并发)。
Moonshot 的消费者 Kimi.com 聊天订阅(Andante、Moderato 等)与上述两条 API 路径均无关。聊天订阅授予 API 访问权限。Kimi Code Plan 才是针对 API 的订阅。
Moonshot 还运营一个仅限中国大陆的平台(platform.moonshot.cn,基础 URL 为 https://api.moonshot.cn/v1),以人民币计费。仅当您在中国大陆运营时使用。

方案概览

Kimi Code Plan(订阅)

属性
端点https://api.kimi.com/coding/v1
并发上限 30 个并发请求
计费统一月费订阅
密钥来源kimi.com/code

开发者 API(按 token 付费)

模型价格(每 100 万 输入 / 输出 token)上下文窗口说明
Kimi K2.6 Coding 推荐0.60/0.60 / 2.50约 256k tokens最新版,针对代码审查调优。
Kimi K2.50.60/0.60 / 2.50约 256k tokens上一代,仍有很强能力。
Kimi K2 (0905)更低价格档位约 128k tokens稳定的通用模型。
开发者 API 端点:https://api.moonshot.ai/v1(国际版)。并发随充值档位伸缩 — Tier 1($10 充值)起始约 50 并发,Tier 5 最多约 1000 并发。

创建 API 密钥

创建 API 密钥需要 Moonshot 账号。
  1. 访问 kimi.com/code 并订阅该方案。
  2. 打开订阅的密钥管理区域。
  3. 创建 Kimi Code 密钥并复制。
Kimi Code 密钥仅适用于 https://api.kimi.com/coding/v1。发送到 api.moonshot.ai 会返回 401。

在 Kodus 中配置 Moonshot

主流程是在 Kodus Cloud 上使用 BYOK — 精选的 Kimi K2.6 Coding 卡片会为您处理端点切换。希望在进程层级固定提供商的自托管用户可以改用环境变量。

方式 1 — Kodus Cloud 上的 BYOK(推荐)

1

打开 BYOK 并选择 Kimi K2.6 Coding

访问 app.kodus.io/organization/byok,在主模型部分点击 Kimi K2.6 Coding 卡片。
2

选择您的方案

卡片会展开一个 Plan 选择器。请选择:基础 URL 和”获取密钥”链接会自动更新。
3

粘贴您的 API 密钥

只需密钥。对于 Kimi Code Plan 用户,Kodus 会在高级设置中预填 maxConcurrentRequests=30(匹配文档中的上限)。
4

测试并保存

点击测试并保存。Kodus 会通过一次低成本的元数据调用探测端点,成功后持久化配置。401 表示密钥与所选方案的端点不匹配。

调优推理(可选)

Kimi K2.6 Coding 默认开启推理 — 精选卡片预填 Thinking: Medium,对于 OpenAI 兼容的提供商会发出 thinking: { type: "enabled" }。两种常见覆盖:
  • 禁用 thinking,在小型 PR 上实现更快/更便宜的审查:
    {
      "thinking": { "type": "disabled" }
    }
    
  • 强制特定 token 预算(如果 Moonshot 在您的档位支持 budget_tokens):
    {
      "thinking": { "type": "enabled", "budget_tokens": 25000 }
    }
    
无需命名空间包装 — Kodus 在发送前会在 openaiCompatible(当前提供商)下自动包装。详见 主 BYOK 文档 → 自定义 JSON 覆盖

调优并发

  • Kimi Code Plan:保留预填的 maxConcurrentRequests=30(文档上限)。更高会返回 429。
  • 开发者 API:保持为空(无上限)。实际限制随充值档位伸缩 — Tier 1(约 10充值)允许约50并发;Tier5(10 充值)允许约 50 并发;Tier 5(约 3000)允许约 1000。如果审查时看到 429,请显式下调。
将 Kimi 配置为 Main,同时保留一个 OpenAI 或 Anthropic 密钥作为 Fallback — 如果 Moonshot 返回 429 或 402,Kodus 会自动故障转移。

方式 2 — 手动配置

如果您需要精选目录中没有的 Kimi 变体(例如 kimi-k2.5kimi-k2-0905),请点击目录底部的手动配置并填写:
字段
ProviderOpenAI Compatible
Base URLhttps://api.moonshot.ai/v1(开发者 API)
https://api.kimi.com/coding/v1(Kimi Code Plan)
https://api.moonshot.cn/v1(仅限中国大陆)
Modelkimi-k2.6kimi-k2.6kimi-k2.5kimi-k2-0905kimi-k2
API Key您的 Moonshot 或 Kimi Code 密钥(与上述基础 URL 匹配)
Max Concurrent RequestsKimi Code Plan 上为 30;开发者 API 保持为空(随充值档位伸缩)

方式 3 — 自托管(环境变量)

如果您以 Fixed Mode 运行 Kodus(单一全局提供商,无按组织 BYOK),在 API + worker 容器的 .env 中配置 Moonshot:
# Moonshot(Kimi)配置(固定模式)
API_LLM_PROVIDER_MODEL="kimi-k2.6"
API_OPENAI_FORCE_BASE_URL="https://api.moonshot.ai/v1"    # Kimi Code Plan 使用 https://api.kimi.com/coding/v1
API_OPEN_AI_API_KEY="your-moonshot-or-kimi-code-api-key"
仅在有意禁用 BYOK 的自托管 Kodus 安装中才需要这条路径。如果您的自托管实例启用了 BYOK,请优先使用方式 1 — 精选卡片会为您处理端点逻辑。
编辑 .env 后重启 API 和 worker 容器,然后验证集成:
docker-compose logs api worker | grep -iE "moonshot|kimi"
完整的自托管设置(域名、安全密钥、数据库、webhook、反向代理)请参见通用 VM 部署指南,只需将 LLM 部分替换为上面的配置。

在 Kimi Code Plan、开发者 API 和聚合器之间选择

  • Kimi Code Plan — 可预测的统一月费、30 并发上限、专为编码工作流优化的专用 api.kimi.com/coding/v1 端点。适合 PR 流量稳定、团队常态化运行的场景。
  • Moonshot 开发者 API — 按 token 付费,并发随充值档位伸缩,灵活度最高。适合波动性负载。
  • OpenRouter 代理 — 如果您希望多个提供商统一结算,OpenRouter 以少量路由加价暴露 Kimi 模型。当 Kimi 是混合提供商矩阵中的一员、而不是主要工作负载时选择它。

故障排查

  • Kimi Code Plan 密钥仅在 api.kimi.com/coding/v1 上工作。
  • 来自 platform.moonshot.ai 的开发者 API 密钥仅在 api.moonshot.ai/v1 上工作。
  • 来自 platform.moonshot.cn 的开发者 API 密钥仅在 api.moonshot.cn/v1 上工作。
  • 在精选卡片中,确认 Plan 选择器与密钥来源匹配。
  • 开发者 API 按 token 付费。余额耗尽时请求返回 HTTP 402。
  • 在控制台的账单页面充值,或设置月度上限以避免超支。
  • Kimi Code Plan 虽然是统一定价,但受 30 并发上限和配额窗口约束 — 429 意味着您撞到了其中之一。
  • 确认模型名称与目录匹配(kimi-k2.6kimi-k2.6kimi-k2.5kimi-k2-0905kimi-k2)。
  • 请查看 platform.kimi.ai/docs 了解当前列表 — 新版本发布频繁。
  • 一段时间闲置后的首次调用可能在 Moonshot 侧冷启动。
  • 如果延迟重要,kimi-k2-0905 在常规审查上通常比 K2.6 变体更快。
  • 中国大陆以外的用户应始终使用 api.moonshot.aiapi.kimi.com。从大陆以外访问 api.moonshot.cn 可能不通或被限速。
  • 确认您的 Kodus 部署允许对所选端点的出站 HTTPS。

相关链接