Módulo 4.3 - Custo e dimensionamento

📐 A regra linear: N agentes = N× custo

Cada teammate = 1 contexto = 1 multiplicador linear. 5 agentes ≈ 5× sessão única. Saber a 'lei do custo' impede a sedução do swarm.

📊 Decomposição do custo

Custo = N × tokens médios × preço modelo
Ganho ≠ N×
Coordenação tem custo (mensagens)
Idle queima tokens sem retorno

⚠️ Pegada típica

'Adicionar mais agentes vai resolver'. Quase nunca. Adicione modelo certo e prompt melhor antes.

🎯 3-5 teammates é o doce-spot

Doc oficial e prática convergem. Acima de 5, ganhos diminuem rápido. Menos de 3, raramente vale Teams sobre subagentes.

📌 Heurística de tamanho

Quando aumentar.

•3 = mínimo viável (1 deve ser QA)
•4-5 = sweet spot cross-layer
•5-6 tasks/teammate
•Promover só com evidência

💡 Se tem 15 tasks

Comece com 3 teammates. Aumente se medir gargalo.

🧬 Modelo certo por papel

Misturar modelos por papel reduz custo total em 30-50% sem perda de qualidade. QA simples → Haiku, Dev → Sonnet, Architect → Opus.

📊 Mix recomendado

Tech Writer → Haiku 4.5
QA simples → Haiku 4.5
QA complexo → Sonnet 4.6
Backend/Frontend → Sonnet 4.6
Security → Sonnet 4.6
Architect → Opus 4.7 (decisões críticas)

📊 Como medir custo real

Use /cost no Claude Code, hooks PostToolUse para logar tokens, relatórios por teammate. Sem números, 'sentir caro' vira intuição ruim.

📌 O que medir

Métricas por papel.

•Tokens input/output por papel
•Tempo de wall-clock por papel
•Ratio output/input
•Identificar role mais caro
•Comparar com run anterior

✂️ Quando subagent é mais barato

Pesquisa, busca de arquivos, sumário de logs — não precisa conversar. Subagent ganha em custo.

✓ Subagent suficiente

✓Sumário de logs
✓Busca de arquivos
✓PR review read-only
✓Análise de doc

✗ Precisa Team

✗Cross-layer
✗Loop Dev↔QA
✗Hipóteses concorrentes
✗Implementação cooperativa

🛑 Desligue cedo

Se um teammate vai para o caminho errado, não espere ele 'achar'; desligue e respawne com prompt corrigido. Reset é barato.

📌 Sinais de descarrilamento

Quando puxar o gatilho.

•Repete a mesma pergunta
•Tools wrong (ex: editando lugar errado)
•Tempo > 2× do esperado
•Output não converge para deliverable

💡 Reset com aprendizado

Salve em arquivo o que ele descobriu antes de matar; spawne novo com isso no prompt.

📌 Resumo do Módulo

✓

A regra linear: N agentes = N× custo — Sem mágica

✓

3-5 teammates é o doce-spot — O número que importa

✓

Modelo certo por papel — Haiku para QA simples

✓

Como medir custo real — /cost e telemetria

✓

Quando subagent é mais barato — Pesquisa que não conversa

✓

Desligue cedo — Mate o que está descarrilando

Próximo módulo:

4.4 — Encerramento limpo

← Voltar para Trilha Próximo Módulo →