Chutesの動作方法
Chutes AIはオープンソースモデル向けの分散型サーバーレスコンピュートプラットフォームです。OpenAI互換の推論エンドポイントを公開し、ペイアズユーゴー値の倍数として表現された上限までAPIの使用量をバンドルするサブスクリプションプランを提供しています — Z.AI GLMコーディングプランと構造が似ていますが、完全なオープンソースカタログ(DeepSeek、Llama、Qwen、MiniMax、Kimi、その他多数)をカバーしています。 KodusはChutesと他のものと同じOpenAI互換アダプターを通じて通信するため、コードの変更は不要です — BYOKクレデンシャルだけです。プランの概要
価格とクォータルールは変更されます。ティアを選択する前に、chutes.ai/pricingで必ず確認してください。
| ティア | 月額料金 | 備考 |
|---|---|---|
| Base | 約$3/月 | エントリーティア;限られたモデル選択。 |
| Standard | 約$10/月 | フロンティアモデル(DeepSeek V3、MiniMax M2.1など)に必要。 |
| Pro | 約$20+/月 | より大量のレビューのための高い5×上限。 |
| Enterprise | カスタム | Chutesに問い合わせ。 |
- 5×上限は月次でリセットされ、ペイアズユーゴーで支払う同じトークン単価に対して計算されます。
- 一部のモデルにはStandard以上が必要です — ベースティアはフロンティアコーディングモデルを含みません。
- Chutesは一部のモデルに信頼実行環境(機密コンピュート)バリアントを示す
-TEEサフィックスを付けます。
推奨モデル
Chutesは機密コンピュートバリアントに-TEE サフィックスを付けた、HuggingFaceスタイルの org/model 識別子を使用します:
| モデルID | 備考 |
|---|---|
deepseek-ai/DeepSeek-V3-0324-TEE | フロンティアコーディングモデル;強力なエージェント動作。Standard以上が必要。 |
moonshotai/Kimi-K2-Instruct | 長コンテキストKimi K2 — 大きなPRに最適。 |
Qwen/Qwen3-Coder-480B-A35B-Instruct | 専門コーダー。 |
chutes/MiniMaxAI/MiniMax-M2.1-TEE | 代替フロンティアオプション。 |
APIキーの作成
- chutes.aiにアクセスしてアカウントを作成します。
- chutes.ai/pricingでティアにサブスクライブするか、希望する場合はペイアズユーゴーを有効にします。
- 開発者コンソールを開いてAPIキーを作成します。すぐにコピーします。
KodusでChutesを設定する
オプション1 — Kodus CloudでのBYOK(推奨)
- Kodusウェブ UIで、設定 → BYOKを開き、メインモデル(またはフォールバック)の編集をクリックします。
- ベースURLと自由テキストのモデル名を入力できるよう、フォームをカスタムモードに切り替えます。
-
フィールドを入力します:
フィールド 値 プロバイダー OpenAI CompatibleAPIキー Chutes APIキー ベースURL https://llm.chutes.ai/v1モデル 例: deepseek-ai/DeepSeek-V3-0324-TEE最大同時リクエスト数 3〜5が安全な出発点;上限に達しなければ上げる最大出力トークン 切り捨てが発生しない限りデフォルトのまま - 保存します。Kodusはエンドポイントに対してキーを検証し、401 / 404があれば即座に表示されます。
- PRを開いてレビューをトリガーします;BYOKステータスバッジは最初の成功した呼び出しで緑になります。
Chutesは分散コンピュートで実行されるため、コールドスタートと末尾レイテンシは専用プロバイダーよりも変動が大きくなります。ノードが遅いか月次上限に達した場合にKodusがフェイルオーバーできるよう、OpenAIまたはAnthropicキーをフォールバックとして設定します。
オプション2 — セルフホスト(環境変数)
固定モード(単一グローバルプロバイダー、BYOKなし)でKodusを実行している場合は、APIとワーカーコンテナの.env でChutesを設定します:
このパスは意図的にBYOKを無効にしているセルフホストKodusインストールにのみ必要です。セルフホストインスタンスでBYOKが有効な場合は、オプション1を優先してください — UIベースのフローはクラウドと同じです。
.env を編集後、APIとワーカーコンテナを再起動して確認します:
Chutesを選ぶ場合
- サブスクリプション価格で最も幅広いオープンソースカタログが欲しい場合 — フロンティアDeepSeek / MiniMax / Qwnを定額料金で予測可能な上限付きで使用。
- 機密コンピュートが重要な場合 — Chutesはコンプライアンス体制で必要な場合に信頼実行環境内で実行される
-TEEバリアントを提供。 - 低〜中程度のボリュームで実行しており、安価なティアの5×PAYG上限内に収まる場合。
トラブルシューティング
モデルが上位ティアを必要とする
モデルが上位ティアを必要とする
- フロンティアモデル(DeepSeek V3、MiniMax M2.1、一部Qwnバリアント)は2026年2月以降Standardティア以上にゲートされています。
- アップグレードするか、現在のティアで利用可能なモデル(小型LlamaまたはQwnバリアント)を選択してください。
月次5×上限に達した
月次5×上限に達した
- Chutesダッシュボードで現在の使用量を確認します。
- 上限を延ばすために一時的により安価なモデルに切り替えるか、ティアをアップグレードします。
- 上限に達している間もレビューが継続されるよう
フォールバックBYOKプロバイダーを設定します。
401 / 認証エラー
401 / 認証エラー
- Chutesダッシュボードでキーがアクティブでサブスクリプションが最新であることを確認します。
.envの値に末尾のスペースや引用符がないことを確認します。
モデルが見つからない
モデルが見つからない
- Chutesは
org/model形式を使用し、一部のバリアントは-TEE(機密コンピュート)で終わります。llm.chutes.ai/v1/modelsで正確な大文字小文字を確認してください。
遅いまたは不安定なレイテンシ
遅いまたは不安定なレイテンシ
- Chutesは分散コンピュートで実行されるため、末尾レイテンシは専用クラウドより高くなります。
- レイテンシに敏感なレビューには専用プロバイダーを優先し、夜間またはバッチレビュージョブにChutesを予約するか、高速プロバイダーを
メインとして、Chutesをフォールバックとして設定します。
接続エラー
接続エラー
- サーバーが
llm.chutes.aiに到達できることを確認します。 - APIとワーカーのログで正確な上流エラーを確認します。