Synthetic 工作原理
Synthetic 是一个订阅式服务,在专用基础设施上运行开源编程 LLM,并通过 OpenAI 兼容(以及 Anthropic 兼容)API 提供服务。您支付的不是按 token 计费,而是统一月费,获得覆盖平台上所有模型的充裕速率配额。 它被定位为 Claude 200/月套餐的直接替代方案:同样的价位、数倍的速率限制预算、以及开源模型的自由选择。 Kodus 通过 OpenAI 兼容端点连接 Synthetic,无需任何适配器更改 — 仅需 BYOK 凭证。方案概览
价格和速率限制会变化。选择套餐前请先在 synthetic.new/pricing 确认。
订阅(代码审查推荐)
| 方案 | 价格 | 速率限制 |
|---|---|---|
| 月付 | 约 1/天) | 每 5 小时窗口约 500 条消息 |
| 企业 / 按量计费 | 联系 Synthetic | 提供按 token 付费方式 |
- 所有标准模型都在订阅范围内 — 通过修改
model字段任意切换。 - 速率限制按5 小时滚动窗口执行,不是按月 — 规划并发时要装得下这个窗口。
- Synthetic 不在您的 prompt/completion 上训练,并在 14 天内删除 API 数据。
推荐模型
Synthetic 使用 HuggingFace 前缀格式(hf:org/model)暴露模型。代码审查的几个强力选择:
| 模型 ID | 说明 |
|---|---|
hf:zai-org/GLM-4.6 | GLM 系列;通用审查的均衡选择。 |
hf:moonshotai/Kimi-K2-Instruct | 长上下文 Kimi K2 — 大型 PR 上表现出色。 |
hf:Qwen/Qwen3-Coder-480B-A35B-Instruct | 强大的专业编码模型。 |
hf:deepseek-ai/DeepSeek-V3.1 | DeepSeek V3.1;出色的 Agent / 编码行为。 |
创建 API 密钥
- 访问 synthetic.new 注册或登录。
- 在 synthetic.new/pricing 订阅套餐。
- 打开开发者控制台并创建 API 密钥。立即复制 — 稍后您将看不到完整密钥。
在 Kodus 中配置 Synthetic
主流程是在 Kodus Cloud 上使用 BYOK。自托管安装可以选用环境变量作为次要方式。方式 1 — Kodus Cloud 上的 BYOK(推荐)
- 在 Kodus Web UI 中打开设置 → BYOK,点击 Main 模型旁的编辑(或 Fallback)。
- 将表单切换到 Custom 模式,以便输入基础 URL 和自由格式的模型名称。
-
填写字段:
字段 值 Provider OpenAI CompatibleAPI Key 您的 Synthetic API 密钥 Base URL https://api.synthetic.new/openai/v1Model 例如 hf:zai-org/GLM-4.6(使用hf:前缀和完整的 HuggingFace 路径)Max Concurrent Requests 从 3–5起步,以适应大型 PR 的 5 小时预算Max Output Tokens 除非遇到截断,否则保持默认 - 保存。Kodus 会针对该端点验证密钥,任何 401 / 404 会立即显示。
- 打开任意 PR 触发审查;首次成功调用后,设置中的 BYOK 状态徽章会变绿。
将 Synthetic 配置为 Main,同时保留一个 OpenAI 或 Anthropic 密钥作为 Fallback — 5 小时窗口满了之后,Kodus 会自动故障转移,审查继续流动。
方式 2 — 自托管(环境变量)
如果您以 Fixed Mode 运行 Kodus(单一全局提供商,无按组织 BYOK),在 API + worker 容器的.env 中配置 Synthetic:
仅在有意禁用 BYOK 的自托管 Kodus 安装中才需要这条路径。如果您的自托管实例启用了 BYOK,请优先使用方式 1 — 基于 UI 的流程与 Cloud 上相同。
.env 后重启 API 和 worker 容器,然后验证:
何时选择 Synthetic
- 您的主力模型是开源模型(Kimi、DeepSeek、Qwen Coder、GLM),希望统一月费,而不是在多个提供商间周旋 token 开销。
- **您在比较 Claude Max(30/月在同等能力的编程模型上提供数倍的速率预算。
- 您重视数据态势 — Synthetic 明确不训练用户数据,API 数据 14 天内删除。
故障排查
5 小时窗口内 429 请求过多
5 小时窗口内 429 请求过多
- 订阅预算是按5 小时滚动窗口,不是按小时或按月。在 Synthetic 仪表板查看最近发送了多少请求。
- 等待窗口滚动,或在 BYOK 中降低
Max Concurrent Requests,或升级 / 叠加套餐。 - 配置
FallbackBYOK 提供商,让速率受限时审查仍能继续。
401 / 身份验证错误
401 / 身份验证错误
- 在 Synthetic 仪表板确认密钥仍然有效且订阅未过期。
- 确保
.env值中没有尾随空格或引号。
模型未找到
模型未找到
- Synthetic 使用
hf:org/model格式。省略hf:前缀或大小写不对会返回 404。 - 在 dev.synthetic.new/docs/openai/models 上核对。
首次调用冷启动长
首次调用冷启动长
- 部分较大模型在一段时间不活动后的首次使用可能冷启动。
- 如果首次调用延迟阻塞 Kodus 健康检查,在打开 PR 之前通过一个小型测试请求预热模型。
连接错误
连接错误
- 确认您的服务器可以访问
api.synthetic.new。 - 查看 API 和 worker 日志获取具体的上游错误。