Cómo funciona Chutes
Chutes AI es una plataforma de cómputo sin servidor descentralizada para modelos de código abierto. Expone un endpoint de inferencia compatible con OpenAI y ofrece planes de suscripción que agrupan el uso de la API hasta un límite expresado como múltiplo del valor equivalente de pago por token — similar en estructura al GLM Coding Plan de Z.AI, pero cubriendo el catálogo completo de código abierto (DeepSeek, Llama, Qwen, MiniMax, Kimi y muchos más). Kodus se comunica con Chutes a través del mismo adaptador compatible con OpenAI que usa para todo lo demás, por lo que no hay cambios de código — solo credenciales BYOK.Planes de un vistazo
Los precios y las reglas de cuota cambian. Siempre confirma en chutes.ai/pricing antes de elegir un nivel.
| Nivel | Tarifa mensual | Notas |
|---|---|---|
| Base | ~$3/mes | Nivel de entrada; selección de modelos limitada. |
| Standard | ~$10/mes | Requerido para modelos frontier (DeepSeek V3, MiniMax M2.1, etc.). |
| Pro | ~$20+/mes | Cap 5× más alto para mayor volumen de revisiones. |
| Enterprise | personalizado | Contactar a Chutes. |
- El cap 5× se reinicia mensualmente y se calcula contra los mismos precios por token que pagarías en pago por uso.
- Algunos modelos requieren Standard o superior — el nivel base no incluye modelos frontier de codificación.
- Chutes marca algunos modelos con el sufijo
-TEEindicando variantes de entorno de ejecución confiable (cómputo confidencial).
Modelos recomendados
Chutes usa identificadores estilo HuggingFaceorg/model, a veces con un sufijo -TEE para la variante de cómputo confidencial:
| ID del modelo | Notas |
|---|---|
deepseek-ai/DeepSeek-V3-0324-TEE | Modelo frontier de codificación; comportamiento agéntico robusto. Requiere ≥ Standard. |
moonshotai/Kimi-K2-Instruct | Kimi K2 de contexto largo — excelente en PRs grandes. |
Qwen/Qwen3-Coder-480B-A35B-Instruct | Codificador especializado. |
chutes/MiniMaxAI/MiniMax-M2.1-TEE | Opción frontier alternativa. |
Crear una clave API
- Ve a chutes.ai y crea una cuenta.
- Suscríbete a un nivel en chutes.ai/pricing, o habilita el pago por uso si lo prefieres.
- Abre la consola de desarrollador y crea una clave API. Cópiala de inmediato.
Configurar Chutes en Kodus
Opción 1 — BYOK en Kodus Cloud (recomendado)
- En la interfaz web de Kodus, abre Configuración → BYOK y haz clic en Editar en el modelo Principal (o Respaldo).
- Cambia el formulario al modo Personalizado para poder ingresar una URL base y un nombre de modelo libre.
-
Completa los campos:
Campo Valor Proveedor OpenAI CompatibleClave API tu clave API de Chutes URL Base https://llm.chutes.ai/v1Modelo por ejemplo, deepseek-ai/DeepSeek-V3-0324-TEEMáx. de Solicitudes Concurrentes 3–5es un inicio seguro; aumenta si no alcanzas el capMáx. de Tokens de Salida deja el valor predeterminado a menos que tengas truncamiento - Guarda. Kodus valida la clave contra el endpoint y muestra cualquier error 401 / 404 de inmediato.
- Abre un PR para activar una revisión; el indicador de estado BYOK se pone verde en la primera llamada exitosa.
Dado que Chutes se ejecuta en cómputo descentralizado, la latencia de arranque en frío y la latencia de cola varían más que en proveedores dedicados. Configura una clave de OpenAI o Anthropic como Respaldo para que Kodus pueda conmutar cuando un nodo sea lento o se alcance el cap mensual.
Opción 2 — Alojamiento autónomo (variables de entorno)
Si ejecutas Kodus en Modo Fijo (proveedor global único, sin BYOK por organización), configura Chutes en el.env de tus contenedores de API + worker:
Esta opción solo es necesaria para instalaciones de Kodus con alojamiento autónomo que deshabilitan deliberadamente el BYOK. Si el BYOK está habilitado en tu instancia con alojamiento autónomo, prefiere la Opción 1 — el flujo basado en la interfaz es el mismo que en Cloud.
.env, luego verifica:
Cuándo elegir Chutes
- Quieres el catálogo de código abierto más amplio a un precio de suscripción — DeepSeek / MiniMax / Qwen frontier a una tarifa plana con caps predecibles.
- Te importa el cómputo confidencial — Chutes ofrece variantes
-TEEque se ejecutan dentro de entornos de ejecución confiables, útil si tu postura de cumplimiento lo requiere. - Estás operando a volumen bajo o medio y te ajustas dentro del cap de 5× del PAYG de un nivel económico.
Solución de problemas
El modelo requiere un nivel superior
El modelo requiere un nivel superior
- Los modelos frontier (DeepSeek V3, MiniMax M2.1, algunas variantes de Qwen) están limitados al nivel Standard y superiores desde febrero de 2026.
- Actualiza, o elige un modelo disponible en tu nivel actual (variantes más pequeñas de Llama o Qwen).
Cap mensual 5× alcanzado
Cap mensual 5× alcanzado
- Verifica el uso actual en el panel de Chutes.
- Cambia temporalmente a un modelo más barato para extender el cap, o actualiza el nivel.
- Configura un proveedor BYOK de
Respaldopara que las revisiones sigan funcionando mientras estás en el cap.
Errores 401 / de autenticación
Errores 401 / de autenticación
- Confirma que la clave esté activa en el panel de Chutes y la suscripción esté vigente.
- Asegúrate de que no haya espacios al final ni comillas en el valor del
.env.
Modelo no encontrado
Modelo no encontrado
- Chutes usa el formato
org/model, con algunas variantes que terminan en-TEE(cómputo confidencial). Verifica la capitalización exacta en llm.chutes.ai/v1/models.
Latencia lenta o inconsistente
Latencia lenta o inconsistente
- Chutes se ejecuta en cómputo descentralizado, por lo que la latencia de cola es mayor que en nubes dedicadas.
- Para revisiones sensibles a la latencia, prefiere proveedores dedicados; reserva Chutes para revisiones nocturnas o por lotes, o configura un proveedor rápido como
Principaly Chutes comoRespaldo.
Errores de conexión
Errores de conexión
- Confirma que tu servidor pueda alcanzar
llm.chutes.ai. - Revisa los registros de la API y del worker para ver el error upstream exacto.