Verificando acesso...

MÓDULO 4.3

💰 Custo e dimensionamento

Token economics, modelo por papel, regras de tamanho e medição.

6
Tópicos
45
Minutos
Intermediário
Nível
Reference
Tipo
1

📐 A regra linear: N agentes = N× custo

Cada teammate = 1 contexto = 1 multiplicador linear. 5 agentes ≈ 5× sessão única. Saber a 'lei do custo' impede a sedução do swarm.

📊 Decomposição do custo

  • Custo = N × tokens médios × preço modelo
  • Ganho ≠ N×
  • Coordenação tem custo (mensagens)
  • Idle queima tokens sem retorno

⚠️ Pegada típica

'Adicionar mais agentes vai resolver'. Quase nunca. Adicione modelo certo e prompt melhor antes.

2

🎯 3-5 teammates é o doce-spot

Doc oficial e prática convergem. Acima de 5, ganhos diminuem rápido. Menos de 3, raramente vale Teams sobre subagentes.

📌 Heurística de tamanho

Quando aumentar.

  • 3 = mínimo viável (1 deve ser QA)
  • 4-5 = sweet spot cross-layer
  • 5-6 tasks/teammate
  • Promover só com evidência

💡 Se tem 15 tasks

Comece com 3 teammates. Aumente se medir gargalo.

3

🧬 Modelo certo por papel

Misturar modelos por papel reduz custo total em 30-50% sem perda de qualidade. QA simples → Haiku, Dev → Sonnet, Architect → Opus.

📊 Mix recomendado

  • Tech Writer → Haiku 4.5
  • QA simples → Haiku 4.5
  • QA complexo → Sonnet 4.6
  • Backend/Frontend → Sonnet 4.6
  • Security → Sonnet 4.6
  • Architect → Opus 4.7 (decisões críticas)
4

📊 Como medir custo real

Use /cost no Claude Code, hooks PostToolUse para logar tokens, relatórios por teammate. Sem números, 'sentir caro' vira intuição ruim.

📌 O que medir

Métricas por papel.

  • Tokens input/output por papel
  • Tempo de wall-clock por papel
  • Ratio output/input
  • Identificar role mais caro
  • Comparar com run anterior
5

✂️ Quando subagent é mais barato

Pesquisa, busca de arquivos, sumário de logs — não precisa conversar. Subagent ganha em custo.

✓ Subagent suficiente

  • Sumário de logs
  • Busca de arquivos
  • PR review read-only
  • Análise de doc

✗ Precisa Team

  • Cross-layer
  • Loop Dev↔QA
  • Hipóteses concorrentes
  • Implementação cooperativa
6

🛑 Desligue cedo

Se um teammate vai para o caminho errado, não espere ele 'achar'; desligue e respawne com prompt corrigido. Reset é barato.

📌 Sinais de descarrilamento

Quando puxar o gatilho.

  • Repete a mesma pergunta
  • Tools wrong (ex: editando lugar errado)
  • Tempo > 2× do esperado
  • Output não converge para deliverable

💡 Reset com aprendizado

Salve em arquivo o que ele descobriu antes de matar; spawne novo com isso no prompt.

📌 Resumo do Módulo

A regra linear: N agentes = N× custo — Sem mágica
3-5 teammates é o doce-spot — O número que importa
Modelo certo por papel — Haiku para QA simples
Como medir custo real — /cost e telemetria
Quando subagent é mais barato — Pesquisa que não conversa
Desligue cedo — Mate o que está descarrilando

Próximo módulo:

4.4 — Encerramento limpo