📐 A regra linear: N agentes = N× custo
Cada teammate = 1 contexto = 1 multiplicador linear. 5 agentes ≈ 5× sessão única. Saber a 'lei do custo' impede a sedução do swarm.
📊 Decomposição do custo
- Custo = N × tokens médios × preço modelo
- Ganho ≠ N×
- Coordenação tem custo (mensagens)
- Idle queima tokens sem retorno
⚠️ Pegada típica
'Adicionar mais agentes vai resolver'. Quase nunca. Adicione modelo certo e prompt melhor antes.
🎯 3-5 teammates é o doce-spot
Doc oficial e prática convergem. Acima de 5, ganhos diminuem rápido. Menos de 3, raramente vale Teams sobre subagentes.
📌 Heurística de tamanho
Quando aumentar.
- •3 = mínimo viável (1 deve ser QA)
- •4-5 = sweet spot cross-layer
- •5-6 tasks/teammate
- •Promover só com evidência
💡 Se tem 15 tasks
Comece com 3 teammates. Aumente se medir gargalo.
🧬 Modelo certo por papel
Misturar modelos por papel reduz custo total em 30-50% sem perda de qualidade. QA simples → Haiku, Dev → Sonnet, Architect → Opus.
📊 Mix recomendado
- Tech Writer → Haiku 4.5
- QA simples → Haiku 4.5
- QA complexo → Sonnet 4.6
- Backend/Frontend → Sonnet 4.6
- Security → Sonnet 4.6
- Architect → Opus 4.7 (decisões críticas)
📊 Como medir custo real
Use /cost no Claude Code, hooks PostToolUse para logar tokens, relatórios por teammate. Sem números, 'sentir caro' vira intuição ruim.
📌 O que medir
Métricas por papel.
- •Tokens input/output por papel
- •Tempo de wall-clock por papel
- •Ratio output/input
- •Identificar role mais caro
- •Comparar com run anterior
✂️ Quando subagent é mais barato
Pesquisa, busca de arquivos, sumário de logs — não precisa conversar. Subagent ganha em custo.
✓ Subagent suficiente
- ✓Sumário de logs
- ✓Busca de arquivos
- ✓PR review read-only
- ✓Análise de doc
✗ Precisa Team
- ✗Cross-layer
- ✗Loop Dev↔QA
- ✗Hipóteses concorrentes
- ✗Implementação cooperativa
🛑 Desligue cedo
Se um teammate vai para o caminho errado, não espere ele 'achar'; desligue e respawne com prompt corrigido. Reset é barato.
📌 Sinais de descarrilamento
Quando puxar o gatilho.
- •Repete a mesma pergunta
- •Tools wrong (ex: editando lugar errado)
- •Tempo > 2× do esperado
- •Output não converge para deliverable
💡 Reset com aprendizado
Salve em arquivo o que ele descobriu antes de matar; spawne novo com isso no prompt.
📌 Resumo do Módulo
Próximo módulo:
4.4 — Encerramento limpo