Chutes 工作原理
Chutes AI 是一个面向开源模型的去中心化无服务器计算平台。它暴露一个 OpenAI 兼容的推理端点,并提供订阅套餐 — 套餐将 API 使用量打包到一个以等价按 token 付费价值的倍数表示的上限内,结构上类似 Z.AI GLM 编程计划,但覆盖完整的开源目录(DeepSeek、Llama、Qwen、MiniMax、Kimi 等等)。 Kodus 通过与其他提供商相同的 OpenAI 兼容适配器与 Chutes 通信,无需任何代码修改 — 仅需 BYOK 凭证。方案概览
价格和配额规则会变化。选择套餐前请先在 chutes.ai/pricing 确认。
| 档位 | 月费 | 说明 |
|---|---|---|
| Base | 约 $3/月 | 入门档位;模型选择有限。 |
| Standard | 约 $10/月 | 前沿模型(DeepSeek V3、MiniMax M2.1 等)所需。 |
| Pro | 约 $20+/月 | 更高的 5× 上限,适合较大审查量。 |
| Enterprise | 定制 | 联系 Chutes。 |
- 5× 上限按月重置,基于您按量付费时会支付的同等每 token 价格计算。
- 部分模型需要 Standard 或更高档位 — Base 不包含前沿编程模型。
- Chutes 对部分模型标注
-TEE后缀,表示可信执行环境(机密计算)变体。
推荐模型
Chutes 使用 HuggingFace 风格的org/model 标识符,部分带 -TEE 后缀表示机密计算变体:
| 模型 ID | 说明 |
|---|---|
deepseek-ai/DeepSeek-V3-0324-TEE | 前沿编程模型;出色的 Agent 行为。需要 ≥ Standard。 |
moonshotai/Kimi-K2-Instruct | 长上下文 Kimi K2 — 大型 PR 上表现出色。 |
Qwen/Qwen3-Coder-480B-A35B-Instruct | 专业编码模型。 |
chutes/MiniMaxAI/MiniMax-M2.1-TEE | 另一个前沿选项。 |
创建 API 密钥
- 访问 chutes.ai 注册账号。
- 在 chutes.ai/pricing 订阅档位,或启用按量付费。
- 打开开发者控制台并创建 API 密钥。立即复制。
在 Kodus 中配置 Chutes
方式 1 — Kodus Cloud 上的 BYOK(推荐)
- 在 Kodus Web UI 中打开设置 → BYOK,点击 Main 模型旁的编辑(或 Fallback)。
- 将表单切换到 Custom 模式,以便输入基础 URL 和自由格式的模型名称。
-
填写字段:
字段 值 Provider OpenAI CompatibleAPI Key 您的 Chutes API 密钥 Base URL https://llm.chutes.ai/v1Model 例如 deepseek-ai/DeepSeek-V3-0324-TEEMax Concurrent Requests 3–5是安全起点;未触及上限时可上调Max Output Tokens 除非遇到截断,否则保持默认 - 保存。Kodus 会针对该端点验证密钥,任何 401 / 404 会立即显示。
- 打开 PR 触发审查;首次成功调用后,BYOK 状态徽章变绿。
由于 Chutes 运行在去中心化计算上,冷启动和尾部延迟比专用提供商更多变。配置一个 OpenAI 或 Anthropic 密钥作为 Fallback,以便当节点响应慢或月度上限触及时 Kodus 能故障转移。
方式 2 — 自托管(环境变量)
如果您以 Fixed Mode 运行 Kodus(单一全局提供商,无按组织 BYOK),在 API + worker 容器的.env 中配置 Chutes:
仅在有意禁用 BYOK 的自托管 Kodus 安装中才需要这条路径。如果您的自托管实例启用了 BYOK,请优先使用方式 1 — 基于 UI 的流程与 Cloud 上相同。
.env 后重启 API 和 worker 容器,然后验证:
何时选择 Chutes
- 希望以订阅价获得最广的开源目录 — 前沿 DeepSeek / MiniMax / Qwen,统一月费、可预测的上限。
- 关注机密计算 — Chutes 提供
-TEE变体,在可信执行环境中运行,如果您的合规要求需要这点就有用。 - 运行在中低流量 — 能装进便宜档位的 5× PAYG 上限内。
故障排查
模型需要更高档位
模型需要更高档位
- 前沿模型(DeepSeek V3、MiniMax M2.1、部分 Qwen 变体)自 2026 年 2 月起被限制在 Standard 及以上档位。
- 升级档位,或改用当前档位可用的模型(较小的 Llama 或 Qwen 变体)。
月度 5× 上限触及
月度 5× 上限触及
- 在 Chutes 仪表板查看当前使用情况。
- 临时切换到更便宜的模型以延长上限,或升级档位。
- 配置
FallbackBYOK 提供商,让上限触及时审查仍能继续。
401 / 身份验证错误
401 / 身份验证错误
- 在 Chutes 仪表板确认密钥有效且订阅未过期。
- 确保
.env值中没有尾随空格或引号。
模型未找到
模型未找到
- Chutes 使用
org/model格式,部分变体以-TEE结尾(机密计算)。在 llm.chutes.ai/v1/models 核对精确大小写。
延迟慢或不稳定
延迟慢或不稳定
- Chutes 运行在去中心化计算上,尾部延迟比专用云更高。
- 对延迟敏感的审查,优先使用专用提供商;把 Chutes 留给隔夜或批量审查任务,或把快速提供商配置为
Main、Chutes 为Fallback。
连接错误
连接错误
- 确认您的服务器可以访问
llm.chutes.ai。 - 查看 API 和 worker 日志获取具体的上游错误。