メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.kodus.io/llms.txt

Use this file to discover all available pages before exploring further.

Moonshot の動作方法

Moonshot AI は Kimi ファミリーのモデル(K2、K2.5、K2.6、K2.6 Coding)を公開しています。Kimi は長コンテキストのコード理解とエージェントワークフローに特に強く、API は完全に OpenAI 互換です — Kodus は OpenAI Compatible プロバイダー(または BYOK のキュレートされた Kimi K2.6 Coding カードを介して直接)を通じて通信します。 Moonshot は同じモデルファミリーに 2つのパスを提供しており、それぞれ独自のエンドポイントがあります:
  • Developer APIplatform.moonshot.ai)— ペイパートークン、使用量ごとに課金。同時実行数はリチャージティアとスケールします。
  • Kimi Code Plankimi.com/code)— 専用コーディングエンドポイント付きのサブスクリプション。定額価格、同時実行数は上限付き(30 concurrent)。
Moonshot のコンシューマー Kimi.com チャットサブスクリプション(Andante、Moderato など)は、両方の API パスとは別物です。チャットサブスクリプションは API アクセスを付与しません。Kimi Code Plan が API 専用のサブスクリプションです。
Moonshot は中国限定のプラットフォーム(platform.moonshot.cn、ベース URL https://api.moonshot.cn/v1)も運営しており、CNY で課金されます。中国本土内で運営する場合にのみ使用してください。

プランの概要

Kimi Code Plan(サブスクリプション)

属性
エンドポイントhttps://api.kimi.com/coding/v1
同時実行数30 concurrent リクエストで上限
請求定額サブスクリプション
キーの取得元kimi.com/code

Developer API(ペイパートークン)

モデル価格(入力/出力トークン 100万当たり)コンテキストウィンドウ備考
Kimi K2.6 Coding 推奨0.60/0.60 / 2.50約256kトークン最新、コードレビュー向けにチューニング済み。
Kimi K2.50.60/0.60 / 2.50約256kトークン前世代、まだ有能。
Kimi K2 (0905)より低い価格帯約128kトークン安定した汎用モデル。
Developer API エンドポイント:https://api.moonshot.ai/v1(国際)。同時実行数はリチャージティアとスケール — Tier 1($10 リチャージ)は約50 concurrent から開始し、Tier 5 では最大約1000 concurrent。

APIキーの作成

APIキーを作成するには Moonshot アカウントが必要です。
  1. kimi.com/code にアクセスしてプランにサブスクライブします。
  2. サブスクリプションのキー管理エリアを開きます。
  3. Kimi Code キーを作成してコピーします。
Kimi Code キーは https://api.kimi.com/coding/v1 に対してのみ動作します。api.moonshot.ai に送信すると 401 を返します。

Kodus で Moonshot を設定する

主なフローは Kodus Cloud での BYOK です — キュレートされた Kimi K2.6 Coding カードがエンドポイントの切り替えを処理します。プロセスレベルでプロバイダーを固定することを好むセルフホストユーザーは、代わりに環境変数を使用できます。

オプション1 — Kodus Cloud での BYOK(推奨)

1

BYOK を開き Kimi K2.6 Coding を選択

app.kodus.io/organization/byok にアクセスし、メインモデルセクションの Kimi K2.6 Coding カードをクリックします。
2

プランを選択

カードは Plan セレクターとともに展開します。以下を選択します:ベース URL と “Get a key” リンクは自動的に更新されます。
3

APIキーを貼り付ける

キーのみ。Kimi Code Plan ユーザーの場合、Kodus は Advanced settings に maxConcurrentRequests=30 を事前入力します(文書化された上限と一致)。
4

Test & save

Test & save をクリックします。Kodus は安価なメタデータ呼び出しでエンドポイントをプローブし、成功時に設定を保存します。401 はキーが選択したプランのエンドポイントと一致しないことを意味します。

Reasoning のチューニング(任意)

Kimi K2.6 Coding では Reasoning はデフォルトで ON です — キュレートされたカードは Thinking: Medium を事前入力し、これは OpenAI 互換プロバイダーでは thinking: { type: "enabled" } を生成します。一般的な2つのオーバーライド:
  • 小さな PR でより高速/安価なレビューのために thinking を無効化
    {
      "thinking": { "type": "disabled" }
    }
    
  • 特定のトークン予算を強制(Moonshot がティアで budget_tokens のサポートを追加した場合):
    {
      "thinking": { "type": "enabled", "budget_tokens": 25000 }
    }
    
名前空間のラップは不要です — Kodus が送信前に openaiCompatible(アクティブなプロバイダー)で自動ラップします。詳しくは main BYOK doc → Custom JSON override を参照してください。

同時実行数のチューニング

  • Kimi Code Plan:事前入力された maxConcurrentRequests=30(文書化された上限)を維持します。それ以上にすると 429 を返します。
  • Developer API:空のまま開始(制限なし)。実際の制限はリチャージティアとスケールします — Tier 1(約10リチャージ)は約50concurrentを許可;Tier5(約10 リチャージ)は約50 concurrent を許可;Tier 5(約3000)は約1000 を許可。レビュー時に 429 が発生した場合は明示的に下げてください。
Kimi をメインとして設定し、OpenAI または Anthropic キーをフォールバックとして保持します — Moonshot が 429 または 402 を返した場合、Kodus は自動的にフェイルオーバーします。

オプション2 — 手動設定

キュレートされたカタログにない Kimi バリアント(例:kimi-k2.5 または kimi-k2-0905)が必要な場合、カタログ下部の Configure manually をクリックして以下を入力します:
フィールド
プロバイダーOpenAI Compatible
ベース URLhttps://api.moonshot.ai/v1(Developer API)
https://api.kimi.com/coding/v1(Kimi Code Plan)
https://api.moonshot.cn/v1(中国本土のみ)
モデルkimi-k2.6kimi-k2.6kimi-k2.5kimi-k2-0905kimi-k2
APIキーMoonshot または Kimi Code キー(上記のベース URL と一致)
Max Concurrent RequestsKimi Code Plan では 30;Developer API では空のまま(リチャージティアとスケール)

オプション3 — セルフホスト(環境変数)

固定モード(単一グローバルプロバイダー、組織ごとの BYOK なし)で Kodus を実行している場合は、API とワーカーコンテナの .env で Moonshot を設定します:
# Moonshot (Kimi) configuration (Fixed Mode)
API_LLM_PROVIDER_MODEL="kimi-k2.6"
API_OPENAI_FORCE_BASE_URL="https://api.moonshot.ai/v1"    # or https://api.kimi.com/coding/v1 for Kimi Code Plan
API_OPEN_AI_API_KEY="your-moonshot-or-kimi-code-api-key"
このパスは意図的に BYOK を無効にしているセルフホスト Kodus インストールにのみ必要です。セルフホストインスタンスで BYOK が有効な場合は、オプション1を優先してください — キュレートされたカードがエンドポイントのロジックを処理します。
.env を編集後、API とワーカーコンテナを再起動して統合を確認します:
docker-compose logs api worker | grep -iE "moonshot|kimi"
完全なセルフホストセットアップ(ドメイン、セキュリティキー、データベース、Webhook、リバースプロキシ)については、汎用VMデプロイガイド に従い、LLM ブロックのみ上記のものと置き換えてください。

Kimi Code Plan、Developer API、アグリゲーターの選択

  • Kimi Code Plan — 予測可能な定額コスト、30 concurrent の上限、コーディングワークフロー向けに最適化された専用の api.kimi.com/coding/v1 エンドポイント。予測可能な PR ボリュームを持つ定常運用チームに最適。
  • Moonshot Developer API — ペイパートークン、同時実行数はリチャージティアとスケール、最大の柔軟性。バースト的なワークロードに最適。
  • OpenRouter プロキシ — 多くのプロバイダーにわたる1つの請求関係が欲しい場合、OpenRouter は小さなルーティングマークアップで Kimi モデルを公開します。Kimi が混在プロバイダーフリートの一部で、主要なワークロードではない場合に選択してください。

トラブルシューティング

  • Kimi Code Plan キーは api.kimi.com/coding/v1 に対してのみ動作します。
  • platform.moonshot.ai からの Developer API キーは api.moonshot.ai/v1 に対してのみ動作します。
  • platform.moonshot.cn からの Developer API キーは api.moonshot.cn/v1 に対してのみ動作します。
  • キュレートされたカードでは、Plan セレクターがキーの出所と一致することを確認してください。
  • Developer API はペイパートークンで課金します。残高が尽きた場合、リクエストは HTTP 402 を返します。
  • コンソールの請求セクションで資金を追加するか、驚きを避けるために月次上限を設定します。
  • Kimi Code Plan は定額価格ですが、30 concurrent の上限とクォータウィンドウに縛られます — 429 はそれらのいずれかに達したことを意味します。
  • モデル名がカタログと一致していることを確認します(kimi-k2.6kimi-k2.6kimi-k2.5kimi-k2-0905kimi-k2)。
  • 最新リストについては platform.kimi.ai/docs を確認してください — 新しいバージョンが定期的にリリースされます。
  • 非アクティブ期間後の最初の呼び出しは Moonshot 側でコールドスタートする可能性があります。
  • レイテンシが重要な場合、定期的なレビューには kimi-k2-0905 が一般的に K2.6 バリアントよりも高速です。
  • 中国以外のユーザーは常に api.moonshot.ai または api.kimi.com を使用してください。api.moonshot.cn は中国本土外から到達できないかレート制限される場合があります。
  • Kodus デプロイから選択したエンドポイントへのアウトバウンド HTTPS が許可されていることを確認します。

関連リンク