Pular para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://docs.kodus.io/llms.txt

Use this file to discover all available pages before exploring further.

Como o Moonshot funciona

A Moonshot AI publica a família de modelos Kimi (K2, K2.5, K2.6, K2.6 Coding). O Kimi é particularmente forte em compreensão de código de contexto longo e fluxos agênticos, e a API é totalmente compatível com OpenAI — o Kodus se comunica com ela via o provedor OpenAI Compatible (ou diretamente pelo card curado Kimi K2.6 Coding em BYOK). A Moonshot oferece dois caminhos para a mesma família de modelos, cada um com seu próprio endpoint:
  • Developer API (platform.moonshot.ai) — pay-per-token, cobrado por uso. A simultaneidade escala com seu tier de recarga.
  • Kimi Code Plan (kimi.com/code) — assinatura com um endpoint de codificação dedicado. Preço fixo, simultaneidade limitada (30 simultâneas).
As assinaturas do chat de consumidor Kimi.com da Moonshot (Andante, Moderato, etc.) são separadas de ambos os caminhos de API. Assinaturas de chat não concedem acesso à API. O Kimi Code Plan é a assinatura específica para API.
A Moonshot também opera uma plataforma exclusiva para a China (platform.moonshot.cn, URL base https://api.moonshot.cn/v1) cobrada em CNY. Use apenas se você opera dentro da China continental.

Visão geral dos planos

Kimi Code Plan (assinatura)

AtributoValor
Endpointhttps://api.kimi.com/coding/v1
SimultaneidadeLimitada a 30 requisições simultâneas
CobrançaAssinatura de taxa fixa
Chaves dekimi.com/code

Developer API (pay-per-token)

ModeloPreço (1M tokens entrada / saída)Janela de ContextoNotas
Kimi K2.6 Coding recomendado~0,60/0,60 / 2,50~256k tokensMais recente, ajustado para revisão de código.
Kimi K2.50,60/0,60 / 2,50~256k tokensGeração anterior, ainda capaz.
Kimi K2 (0905)tier inferior~128k tokensModelo estável de propósito geral.
Endpoint da Developer API: https://api.moonshot.ai/v1 (internacional). A simultaneidade escala com o tier de recarga — Tier 1 ($10 de recarga) começa em ~50 simultâneas, até ~1000 simultâneas no Tier 5.

Criando uma Chave de API

Uma conta Moonshot é necessária para criar uma chave de API.
  1. Vá para kimi.com/code e assine o plano.
  2. Abra a área de gerenciamento de chaves da sua assinatura.
  3. Crie uma chave do Kimi Code e copie-a.
Chaves do Kimi Code funcionam apenas contra https://api.kimi.com/coding/v1. Elas retornarão 401 se enviadas para api.moonshot.ai.

Configurar o Moonshot no Kodus

O fluxo principal é BYOK no Kodus Cloud — o card curado Kimi K2.6 Coding lida com a troca de endpoint por você. Usuários self-hosted que preferem fixar o provedor no nível do processo podem usar variáveis de ambiente.

Opção 1 — BYOK no Kodus Cloud (recomendado)

1

Abrir BYOK e escolher Kimi K2.6 Coding

Acesse app.kodus.io/organization/byok e clique no card Kimi K2.6 Coding na seção do modelo Main.
2

Selecionar seu plano

O card expande com um seletor de Plan. Escolha:A URL base e o link “Get a key” atualizam automaticamente.
3

Colar sua chave de API

Apenas a chave. Para usuários do Kimi Code Plan, o Kodus pré-preenche maxConcurrentRequests=30 em Advanced settings (corresponde ao limite documentado).
4

Test & save

Clique em Test & save. O Kodus sonda o endpoint com uma chamada barata de metadados e persiste a configuração em caso de sucesso. 401 significa que a chave não corresponde ao endpoint do plano selecionado.

Ajustar reasoning (opcional)

Reasoning está ON por padrão para o Kimi K2.6 Coding — o card curado pré-preenche Thinking: Medium, que para provedores OpenAI-compatible emite thinking: { type: "enabled" }. Duas sobrescritas comuns:
  • Desabilitar thinking para revisões mais rápidas/baratas em PRs pequenos:
    {
      "thinking": { "type": "disabled" }
    }
    
  • Forçar um budget de tokens específico (se a Moonshot adicionar suporte a budget_tokens no seu tier):
    {
      "thinking": { "type": "enabled", "budget_tokens": 25000 }
    }
    
Não é necessário envolver em namespace — o Kodus faz o auto-wrap sob openaiCompatible (o provider ativo) antes de enviar. Veja main BYOK doc → Custom JSON override para detalhes.

Ajustar simultaneidade

  • Kimi Code Plan: mantenha o maxConcurrentRequests=30 pré-preenchido (o limite documentado). Ir além retorna 429.
  • Developer API: comece vazio (sem limite). Seu limite real escala com seu tier de recarga — Tier 1 (~10derecarga)permite 50simulta^neas;Tier5( 10 de recarga) permite ~50 simultâneas; Tier 5 (~3000) permite ~1000. Reduza explicitamente se você ver 429s no momento da revisão.
Configure o Kimi como Main e mantenha uma chave OpenAI ou Anthropic como Fallback — se a Moonshot retornar 429 ou 402, o Kodus faz failover automaticamente.

Opção 2 — Configuração manual

Se você precisa de uma variante do Kimi que não está no catálogo curado (ex.: kimi-k2.5 ou kimi-k2-0905), clique em Configure manually no final do catálogo e preencha:
CampoValor
ProviderOpenAI Compatible
Base URLhttps://api.moonshot.ai/v1 (Developer API)
https://api.kimi.com/coding/v1 (Kimi Code Plan)
https://api.moonshot.cn/v1 (apenas China continental)
Modelkimi-k2.6, kimi-k2.6, kimi-k2.5, kimi-k2-0905, kimi-k2
API Keysua chave Moonshot ou Kimi Code (correspondente à URL base acima)
Max Concurrent Requests30 no Kimi Code Plan; deixe vazio na Developer API (escala com o tier de recarga)

Opção 3 — Self-hosted (variáveis de ambiente)

Se você executa o Kodus em Fixed Mode (provedor global único, sem BYOK por organização), configure a Moonshot no .env dos seus containers de API e worker:
# Moonshot (Kimi) configuration (Fixed Mode)
API_LLM_PROVIDER_MODEL="kimi-k2.6"
API_OPENAI_FORCE_BASE_URL="https://api.moonshot.ai/v1"    # or https://api.kimi.com/coding/v1 for Kimi Code Plan
API_OPEN_AI_API_KEY="your-moonshot-or-kimi-code-api-key"
Este caminho só é necessário para instalações self-hosted do Kodus que desabilitam deliberadamente o BYOK. Se o BYOK estiver habilitado na sua instância self-hosted, prefira a Opção 1 — o card curado lida com a lógica do endpoint por você.
Reinicie os containers de API e worker após editar o .env, e verifique a integração:
docker-compose logs api worker | grep -iE "moonshot|kimi"
Para a configuração completa self-hosted (domínios, chaves de segurança, banco de dados, webhooks, proxy reverso), siga o guia de implantação em VM genérica e substitua apenas o bloco de LLM pelo acima.

Escolhendo entre Kimi Code Plan, Developer API e agregadores

  • Kimi Code Plan — custo previsível de taxa fixa, limite de 30 simultâneas, endpoint dedicado api.kimi.com/coding/v1 otimizado para fluxos de codificação. Melhor para times em regime estável com volume previsível de PRs.
  • Moonshot Developer API — pay-per-token, simultaneidade escala com o tier de recarga, maior flexibilidade. Melhor para cargas variáveis.
  • Proxy OpenRouter — se você quer uma relação única de cobrança para muitos provedores, o OpenRouter expõe modelos Kimi com uma pequena margem de roteamento. Escolha isso quando o Kimi é parte de uma frota de múltiplos provedores, não uma carga principal.

Solução de problemas

  • Chaves do Kimi Code Plan funcionam apenas contra api.kimi.com/coding/v1.
  • Chaves da Developer API de platform.moonshot.ai funcionam apenas contra api.moonshot.ai/v1.
  • Chaves da Developer API de platform.moonshot.cn funcionam apenas contra api.moonshot.cn/v1.
  • No card curado, confirme que o seletor Plan corresponde à origem da sua chave.
  • A Developer API cobra pay-per-token. Se o saldo acabar, as requisições retornam HTTP 402.
  • Adicione fundos na seção de cobrança do console ou defina um limite mensal para evitar surpresas.
  • O Kimi Code Plan tem preço fixo, mas é limitado pelo seu limite de 30 simultâneas e janelas de cota — 429 significa que você atingiu um.
  • Confirme que o nome do modelo corresponde ao catálogo (kimi-k2.6, kimi-k2.6, kimi-k2.5, kimi-k2-0905, kimi-k2).
  • Verifique platform.kimi.ai/docs para a lista atual — novas versões são lançadas regularmente.
  • A primeira chamada após períodos de inatividade pode ter cold-start do lado da Moonshot.
  • Se a latência importa, kimi-k2-0905 geralmente é mais rápido que as variantes K2.6 para revisões rotineiras.
  • Usuários fora da China devem sempre usar api.moonshot.ai ou api.kimi.com. api.moonshot.cn pode ser inacessível ou ter taxa limitada fora da China continental.
  • Confirme que o HTTPS de saída para o endpoint escolhido é permitido na sua implantação do Kodus.

Relacionados