メインコンテンツへスキップ

Z.AIの動作方法

Z.AI(Zhipu AIが開発)はGLMファミリーのモデルを提供します。APIアクセスに定額サブスクリプションを提供している数少ない主要プロバイダーの1つです:GLMコーディングプランは、トークンごとの課金の代わりに5時間および週次ウィンドウにレート制限が適用される固定月額料金でモデル使用量をバンドルします。 より大量またはバリアブルなワークロードには、Z.AIは同じモデルへのペイパートークンアクセスも標準APIで提供しています。 どちらのパスもOpenAI互換およびAnthropic互換のエンドポイントを公開しているため、Kodusはアダプターの変更なしにそれらと通信できます。

プランの概要

価格とクォータは定期的に変更されます。ティアを選択する前に、z.ai/subscribedocs.z.aiで最新の情報を必ず確認してください。

GLMコーディングプラン(サブスクリプション)

ティア価格(月額換算)APIバリュー換算の概算
Lite約$18/月(四半期課金)月額料金の約15倍
Pro約$30/月(四半期課金)月額料金の約20倍
Max約$80/月(四半期課金)月額料金の約30倍
  • クォータはローリング5時間ウィンドウと週次ウィンドウでリセットされます — これが月次上限ではなく計画の上限です。
  • GLM-5.1、GLM-5-Turbo、GLM-5、GLM-4.5、GLM-4.5-Airが対象です。
  • 専用エンドポイント:https://api.z.ai/api/coding/paas/v4(OpenAI互換)またはhttps://api.z.ai/api/anthropic(Anthropic互換)。

ペイパートークンAPI

モデル価格(入力/出力トークン100万当たり)コンテキストウィンドウ
GLM-5.1 推奨0.95/0.95 / 3.15約200kトークン
GLM-50.72/0.72 / 2.30約131kトークン
GLM-4.50.60/0.60 / 2.20約128kトークン
GLM-4.5-Airより低い価格帯、ルーティング最適化約128kトークン
標準エンドポイント:https://api.z.ai/api/paas/v4(OpenAI互換)。

APIキーの作成

APIキーを作成するにはZ.AIアカウントが必要です。
  1. z.aiにアクセスしてアカウントを作成します(またはサインイン)。
  2. サブスクリプションを希望する場合は、z.ai/subscribeGLMコーディングプランティアを購入します。これがなければ、キーはペイパートークンで課金されます。
  3. コンソールのAPIキーセクションを開きます。
  4. APIキーを作成をクリックし、説明的な名前(例:kodus-prod)を付けてキーをコピーします — 再度見ることはできません。
同じAPIキーはコーディングプランエンドポイントとペイパートークンエンドポイントの両方で機能します。設定したエンドポイントURLに対して課金されます。

KodusでZ.AIを設定する

主なフローはKodus CloudでのBYOKです — Z.AIキーをウェブUIに貼り付ければ完了です。プロセスレベルでプロバイダーを固定することを好むセルフホストユーザーは代わりに環境変数を使用できます。

オプション1 — Kodus CloudでのBYOK(推奨)

  1. Kodusウェブ UIで、設定 → BYOKを開き、メインモデル(またはZ.AIをバックアップのみにしたい場合はフォールバック)の編集をクリックします。
  2. ベースURLと自由テキストのモデル名を入力できるよう、フォームをカスタムモードに切り替えます。
  3. フィールドを入力します:
    フィールド
    プロバイダーOpenAI Compatible
    APIキーZ.AI APIキー
    ベースURLhttps://api.z.ai/api/coding/paas/v4 — GLMコーディングプランサブスクライバー向け
    https://api.z.ai/api/paas/v4 — ペイパートークンアカウント向け
    モデルglm-5.1(推奨) — または glm-5glm-5-turboglm-4.5glm-4.5-air
    最大同時リクエスト数コーディングプランでは3〜5から始め、ペイパートークンではより高く
    最大出力トークン切り捨てが発生しない限りデフォルトのまま
  4. 保存します。Kodusはエンドポイントに対してキーを検証し、401 / 404があれば即座に表示されます。
  5. 任意のPRを開いてレビューをトリガーし、Z.AIがレスポンスを提供していることを確認します — 設定のBYOKステータスバッジは最初の成功した呼び出しで緑になります。
コーディングプランでは、5時間/週次クォータが主な制約です。単一の大きなPRがウィンドウを使い切らないよう、最大同時リクエスト数を十分に低く保ちます — 3が安全な出発点で、429が発生するまで上げてください。
Z.AIをメインモデルとして設定し、OpenAIまたはAnthropicキーをフォールバックとして保持できます。コーディングプランウィンドウが枯渇した場合、Kodusは自動的にフェイルオーバーしてレビューを継続します。

オプション2 — セルフホスト(環境変数)

固定モード(単一グローバルプロバイダー、BYOKなし)でKodusを実行している場合は、APIとワーカーコンテナの .env でZ.AIを設定します:
# Z.AI設定(固定モード)
API_LLM_PROVIDER_MODEL="glm-5.1"                                  # アクセスできる任意のGLMモデル
API_OPENAI_FORCE_BASE_URL="https://api.z.ai/api/coding/paas/v4"   # ペイパートークンは/api/paas/v4を使用
API_OPEN_AI_API_KEY="your-z-ai-api-key"
このパスは意図的にBYOKを無効にしているセルフホストKodusインストールにのみ必要です。セルフホストインスタンスでBYOKが有効な場合は、オプション1を優先してください — UIベースのフローはクラウドと同じです。
.env を編集後、APIとワーカーコンテナを再起動して統合を確認します:
docker-compose logs api worker | grep -iE "z\.ai|glm"
完全なセルフホストセットアップ(ドメイン、セキュリティキー、データベース、Webhook、リバースプロキシ)については、汎用VMデプロイガイドに従い、LLMブロックのみ上記のものと置き換えてください。

コーディングプランとペイパートークンの選択

  • レビュアーが予測可能で定額月額コストを希望する場合はコーディングプランを選択します。5時間および週次クォータは、サブスクリプション料金に対して約15〜30倍の同等APIコストに相当します。
  • トラフィックがバースト的な場合、最大コンテキストウィンドウへの不定期アクセスが必要な場合、またはPR量に応じてコストを線形にスケールしたい場合はペイパートークンを選択します。
  • エンドポイントは API_OPENAI_FORCE_BASE_URL(セルフホスト)またはBYOKベースURL(クラウド)を変更することでいつでも切り替えられます — APIキーは同じです。

トラブルシューティング

  • クォータは5時間ローリングウィンドウ週次ウィンドウで適用されます。どちらかを超えるとHTTP 429が返されます。
  • Z.AIコンソールで残りのクォータを確認します。
  • 次のウィンドウのリセットを待つか、より高いティアにアップグレードするか、スパイク時はベースURLを一時的に https://api.z.ai/api/paas/v4 に切り替えてペイパートークンクレジットを使用します。
  • Z.AIコンソールでキーがアクティブであることを確認します。
  • .env の値に末尾のスペースや引用符がないことを確認します。
  • キーはZ.AIエンドポイント間でグローバルです — 同じキーがコーディングプランとペイパートークンの両方で機能します。
  • モデル名がZ.AIモデルカタログに記載されているものと一致していることを確認します(例:glm-5.1glm-5-turboglm-4.5)。
  • コーディングプランは現在GLMファミリーのみをカバーしています — GLM以外のモデル名は拒否されます。
  • サーバーが api.z.ai に到達できることを確認します。
  • APIとワーカーのログで正確な上流エラーを確認します。
  • アウトバウンドトラフィックが制限されているリージョンにいる場合は、インフラが許可するリバースプロキシを通じてリクエストをルーティングします。
  • 標準APIはコーディングプランクォータとは別のアカウントごとのレート制限を適用します。
  • BYOKコンフィグで maxConcurrentRequests を制限して同時実行数を下げるか、大きなコードレビューをより長い時間にわたって分散させます。

関連リンク