Z.AIの動作方法
Z.AI(Zhipu AIが開発)はGLMファミリーのモデルを提供します。APIアクセスに定額サブスクリプションを提供している数少ない主要プロバイダーの1つです:GLMコーディングプランは、トークンごとの課金の代わりに5時間および週次ウィンドウにレート制限が適用される固定月額料金でモデル使用量をバンドルします。 より大量またはバリアブルなワークロードには、Z.AIは同じモデルへのペイパートークンアクセスも標準APIで提供しています。 どちらのパスもOpenAI互換およびAnthropic互換のエンドポイントを公開しているため、Kodusはアダプターの変更なしにそれらと通信できます。プランの概要
価格とクォータは定期的に変更されます。ティアを選択する前に、z.ai/subscribeとdocs.z.aiで最新の情報を必ず確認してください。
GLMコーディングプラン(サブスクリプション)
| ティア | 価格(月額換算) | APIバリュー換算の概算 |
|---|---|---|
| Lite | 約$18/月(四半期課金) | 月額料金の約15倍 |
| Pro | 約$30/月(四半期課金) | 月額料金の約20倍 |
| Max | 約$80/月(四半期課金) | 月額料金の約30倍 |
- クォータはローリング5時間ウィンドウと週次ウィンドウでリセットされます — これが月次上限ではなく計画の上限です。
- GLM-5.1、GLM-5-Turbo、GLM-5、GLM-4.5、GLM-4.5-Airが対象です。
- 専用エンドポイント:
https://api.z.ai/api/coding/paas/v4(OpenAI互換)またはhttps://api.z.ai/api/anthropic(Anthropic互換)。
ペイパートークンAPI
| モデル | 価格(入力/出力トークン100万当たり) | コンテキストウィンドウ |
|---|---|---|
GLM-5.1 推奨 | 3.15 | 約200kトークン |
| GLM-5 | 2.30 | 約131kトークン |
| GLM-4.5 | 2.20 | 約128kトークン |
| GLM-4.5-Air | より低い価格帯、ルーティング最適化 | 約128kトークン |
https://api.z.ai/api/paas/v4(OpenAI互換)。
APIキーの作成
- z.aiにアクセスしてアカウントを作成します(またはサインイン)。
- サブスクリプションを希望する場合は、z.ai/subscribeでGLMコーディングプランティアを購入します。これがなければ、キーはペイパートークンで課金されます。
- コンソールのAPIキーセクションを開きます。
- APIキーを作成をクリックし、説明的な名前(例:
kodus-prod)を付けてキーをコピーします — 再度見ることはできません。
同じAPIキーはコーディングプランエンドポイントとペイパートークンエンドポイントの両方で機能します。設定したエンドポイントURLに対して課金されます。
KodusでZ.AIを設定する
主なフローはKodus CloudでのBYOKです — Z.AIキーをウェブUIに貼り付ければ完了です。プロセスレベルでプロバイダーを固定することを好むセルフホストユーザーは代わりに環境変数を使用できます。オプション1 — Kodus CloudでのBYOK(推奨)
- Kodusウェブ UIで、設定 → BYOKを開き、メインモデル(またはZ.AIをバックアップのみにしたい場合はフォールバック)の編集をクリックします。
- ベースURLと自由テキストのモデル名を入力できるよう、フォームをカスタムモードに切り替えます。
-
フィールドを入力します:
フィールド 値 プロバイダー OpenAI CompatibleAPIキー Z.AI APIキー ベースURL https://api.z.ai/api/coding/paas/v4— GLMコーディングプランサブスクライバー向けhttps://api.z.ai/api/paas/v4— ペイパートークンアカウント向けモデル glm-5.1(推奨) — またはglm-5、glm-5-turbo、glm-4.5、glm-4.5-air最大同時リクエスト数 コーディングプランでは 3〜5から始め、ペイパートークンではより高く最大出力トークン 切り捨てが発生しない限りデフォルトのまま - 保存します。Kodusはエンドポイントに対してキーを検証し、401 / 404があれば即座に表示されます。
- 任意のPRを開いてレビューをトリガーし、Z.AIがレスポンスを提供していることを確認します — 設定のBYOKステータスバッジは最初の成功した呼び出しで緑になります。
Z.AIをメインモデルとして設定し、OpenAIまたはAnthropicキーをフォールバックとして保持できます。コーディングプランウィンドウが枯渇した場合、Kodusは自動的にフェイルオーバーしてレビューを継続します。
オプション2 — セルフホスト(環境変数)
固定モード(単一グローバルプロバイダー、BYOKなし)でKodusを実行している場合は、APIとワーカーコンテナの.env でZ.AIを設定します:
このパスは意図的にBYOKを無効にしているセルフホストKodusインストールにのみ必要です。セルフホストインスタンスでBYOKが有効な場合は、オプション1を優先してください — UIベースのフローはクラウドと同じです。
.env を編集後、APIとワーカーコンテナを再起動して統合を確認します:
コーディングプランとペイパートークンの選択
- レビュアーが予測可能で定額月額コストを希望する場合はコーディングプランを選択します。5時間および週次クォータは、サブスクリプション料金に対して約15〜30倍の同等APIコストに相当します。
- トラフィックがバースト的な場合、最大コンテキストウィンドウへの不定期アクセスが必要な場合、またはPR量に応じてコストを線形にスケールしたい場合はペイパートークンを選択します。
- エンドポイントは
API_OPENAI_FORCE_BASE_URL(セルフホスト)またはBYOKベースURL(クラウド)を変更することでいつでも切り替えられます — APIキーは同じです。
トラブルシューティング
コーディングプランのクォータ枯渇
コーディングプランのクォータ枯渇
- クォータは5時間ローリングウィンドウと週次ウィンドウで適用されます。どちらかを超えるとHTTP 429が返されます。
- Z.AIコンソールで残りのクォータを確認します。
- 次のウィンドウのリセットを待つか、より高いティアにアップグレードするか、スパイク時はベースURLを一時的に
https://api.z.ai/api/paas/v4に切り替えてペイパートークンクレジットを使用します。
401 / 認証エラー
401 / 認証エラー
- Z.AIコンソールでキーがアクティブであることを確認します。
.envの値に末尾のスペースや引用符がないことを確認します。- キーはZ.AIエンドポイント間でグローバルです — 同じキーがコーディングプランとペイパートークンの両方で機能します。
モデルが見つからない
モデルが見つからない
- モデル名がZ.AIモデルカタログに記載されているものと一致していることを確認します(例:
glm-5.1、glm-5-turbo、glm-4.5)。 - コーディングプランは現在GLMファミリーのみをカバーしています — GLM以外のモデル名は拒否されます。
接続エラー
接続エラー
- サーバーが
api.z.aiに到達できることを確認します。 - APIとワーカーのログで正確な上流エラーを確認します。
- アウトバウンドトラフィックが制限されているリージョンにいる場合は、インフラが許可するリバースプロキシを通じてリクエストをルーティングします。
ペイパートークンのレート制限
ペイパートークンのレート制限
- 標準APIはコーディングプランクォータとは別のアカウントごとのレート制限を適用します。
- BYOKコンフィグで
maxConcurrentRequestsを制限して同時実行数を下げるか、大きなコードレビューをより長い時間にわたって分散させます。