Trilha 5 - Multi-runtime + Capstone

Mapa da trilha

5.1~50 min

🔧 Codex CLI Subagents

TOML, max_threads, spawn_agents_on_csv, Symphony

5.2~45 min

💎 Gemini CLI Subagents

Markdown + YAML, @subagent, paralelismo, built-ins

5.3~50 min

🧩 Padrão portátil

A "interface mental" que vale para os 3 runtimes

5.4~4h

🎓 Capstone: NeuroFlow Pro

5 agentes constroem app full-stack com auth + testes + QA

Conteúdo detalhado

5.1~50 min

🔧 Codex CLI Subagents

TOML, max_threads/max_depth, spawn_agents_on_csv e Symphony.

O que é:

Cada agent é um arquivo TOML em ~/.codex/agents/ (user) ou .codex/agents/ (projeto).

Por que aprender:

Mesma ideia do Claude Code subagents — definição declarativa que vira "tipo" reusável.

Conceitos-chave:

Campos obrigatórios: name, description, developer_instructions; opcionais: model, sandbox_mode, mcp_servers.

O que é:

Seção [agents] no config controla concorrência: max_threads (default 6), max_depth (default 1), job_max_runtime_seconds.

Por que aprender:

É a forma de impedir explosão de custo e nesting descontrolado.

Conceitos-chave:

Threads = paralelismo; depth = recursão; timeout previne workers travados.

O que é:

Array nickname_candidates dá nomes legíveis às múltiplas instâncias do mesmo agent.

Por que aprender:

Sem isso, instâncias ficam como "agent-1, agent-2..." e diagnóstico vira sopa.

Conceitos-chave:

Use /agent para alternar threads; nicknames temáticos ("Athena", "Hermes") ajudam memória.

O que é:

Tool experimental do Codex que processa cada linha de CSV com 1 worker e exporta resultados.

Por que aprender:

Casos como auditar 200 PRs ou gerar resumo de 500 issues ficam triviais.

Conceitos-chave:

1 worker por linha; coleta resultados; respeita max_threads global.

O que é:

Subagents herdam sandbox e approval policies do parent. Erros propagam para o workflow.

Por que aprender:

Em CI/non-interactive, approval que não consegue subir falha o run inteiro — preveja com sandbox.

Conceitos-chave:

sandbox_mode por agent; runtime overrides são herdados; CI deve ter sandbox forte.

O que é:

Spec open-source da OpenAI que turbinou times reportadamente em +500% PRs aterrissados ao usar Linear como control plane.

Por que aprender:

Aponta para "agentes em pipeline" governados por tickets — direção que o mercado todo está tomando.

Conceitos-chave:

Codex como MCP server; Agents SDK para orquestrar; deterministic + reviewable.

Ver Completo

5.2~45 min

💎 Gemini CLI Subagents

Markdown + YAML, @subagent, paralelismo e built-ins.

O que é:

Cada subagent = arquivo .md com frontmatter YAML; corpo do markdown é o system prompt.

Por que aprender:

Familiar para quem usa Claude Code; muito legível; versionável em git.

Conceitos-chave:

Required: name, description, kind; opcionais: tools, model, temperature, max_turns, timeout_mins.

O que é:

Prefixar a instrução com @subagent_name força o uso explícito sem deixar o main agent escolher.

Por que aprender:

Em debug, você quer determinismo; auto-delegation pode atrapalhar reproduzir um bug.

Conceitos-chave:

@nome no início; auto-delegation por padrão; mistura possível ("@codebase_investigator descobre, depois generalist resume").

O que é:

Gemini suporta vários subagents (ou várias instâncias do mesmo) em paralelo, reduzindo wall-clock.

Por que aprender:

Padrão "tool exposto ao agente principal" combinado com paralelismo é poderoso.

Conceitos-chave:

Sem nesting (proteção de recursão); cada subagent isolado em context loop; main agente coleta.

O que é:

Gemini vem com codebase_investigator, cli_help, generalist e browser_agent (experimental) prontos.

Por que aprender:

Antes de criar novo subagent, veja se um built-in já resolve. Reduz manutenção.

Conceitos-chave:

codebase_investigator = exploração; cli_help = doc CLI; generalist = task pesada genérica; browser_agent = web.

O que é:

Subagents podem rodar remotamente (kind: remote). Útil quando quer isolamento ou recursos diferentes.

Por que aprender:

Mover work pesado para máquinas remotas é bom para CI e privacidade local.

Conceitos-chave:

Local default; remote para offload; observabilidade extra recomendada.

O que é:

Subagent não pode invocar outro subagent (recursion protection); tools restritos por allowlist.

Por que aprender:

Modelagem hierárquica não funciona; pense flat e use o main agent como orquestrador.

Conceitos-chave:

Flat > nested; tools whitelisted no frontmatter; isolamento total de contexto.

Ver Completo

5.3~50 min

🧩 Padrão portátil

A "interface mental" que vale para Claude Code, Codex e Gemini.

O que é:

Toda definição de agent em qualquer runtime tem 4 conceitos: papel, tools permitidas, arquivos que possui, e quem recebe seu output.

Por que aprender:

Pensar nesse contrato te dá portabilidade; muda só a sintaxe entre runtimes.

Conceitos-chave:

Role = system prompt; Tools = allowlist; Owned = território; Handoff = mailbox/return.

O que é:

Cada conceito tem um nome em cada runtime: subagent definition (Claude) / TOML agent (Codex) / .md agent (Gemini).

Por que aprender:

Tabela mental de tradução acelera migração e evita "preciso reaprender tudo".

Conceitos-chave:

Frontmatter ↔ TOML ↔ YAML; tools allowlist ↔ tools array; mailbox ↔ N/A em subagents.

O que é:

Implemente o squad de PR review (security + perf + tests) em Claude Code, Codex e Gemini.

Por que aprender:

Ver lado a lado o que muda e o que não muda solidifica a abstração portátil.

Conceitos-chave:

Mesmo prompt base; ajuste sintaxe da definição; tem "team" só em Claude Code; subagents bastam para review.

O que é:

Claude Code Teams quando precisa de mailbox; Codex quando quer Symphony/Linear; Gemini quando integra com Google.

Por que aprender:

Não brigue com o runtime: cada um tem força em cenários distintos.

Conceitos-chave:

Mailbox = Claude; pipeline em ticket = Codex+Symphony; Google Workspace = Gemini.

O que é:

Um prompt-base + 3 wrappers (frontmatter, TOML, YAML) é o que você quer manter no repositório.

Por que aprender:

Reduz drift entre versões; muda 1 vez, propaga para todos.

Conceitos-chave:

Source of truth = .md; wrappers em geradores; CI valida que estão sincronizados.

O que é:

Quando complexidade cresce (cycles, branching, observabilidade), framework Python pode substituir o CLI.

Por que aprender:

CLI vs framework é trade-off de produtividade vs controle. Saber quando trocar.

Conceitos-chave:

CrewAI = papéis; LangGraph = grafo; AG2 = chat; Agents SDK = pipeline declarativo.

Ver Completo

5.4~4h

🎓 Capstone: NeuroFlow Pro

Squad de 5 agentes constrói um app full-stack com auth + testes + relatório QA + doc.

O que é:

App full-stack: API REST (users + posts), front React, JWT, suíte de testes, relatório QA, doc operacional.

Por que aprender:

É realista o suficiente para exercitar todas as armadilhas; pequeno o suficiente para terminar em 4h.

Conceitos-chave:

App rodando em localhost:3000; tests/report.md; docs/build-summary.md; docs/cost-report.md.

O que é:

5 teammates Sonnet com territórios distintos: src/api, src/ui, tests/, audits/, docs/.

Por que aprender:

É a aplicação prática de tudo que veio antes — territórios, mailbox, plan mode, hooks.

Conceitos-chave:

Security Reviewer como subagent definition reusável; Tech Writer com Haiku para reduzir custo.

O que é:

25 pts prompt; 20 pts hooks; 20 pts testes verdes; 15 pts custo; 10 pts cleanup; 10 pts portabilidade.

Por que aprender:

Critérios objetivos forçam você a aplicar conceitos do curso, não só "fazer rodar".

Conceitos-chave:

Auto-avaliação primeiro; depois revisão de pares; pontuar honestamente.

O que é:

Pelo menos 1 hook ativo no projeto: tests passando ao TaskCompleted, ou block-rm em PreToolUse.

Por que aprender:

Sem quality gate, "rodar" não é "qualidade". Hook é o que separa demo de entrega.

Conceitos-chave:

Hooks no .claude/settings.json; logs em arquivo; trigger por matcher.

O que é:

Documento docs/cost-report.md com tokens por teammate, modelo escolhido por papel, e justificativa do tamanho do squad.

Por que aprender:

É o critério que diferencia engenheiro de "cliquei no botão". Mostra que entende custo.

Conceitos-chave:

Tokens por papel; modelo justificado; "por que 5 e não 3"; alternativa considerada.

O que é:

Grave 5 min mostrando spawn, mailbox, idle notifications e cleanup; depois discuta decisões.

Por que aprender:

Apresentar consolida; outros aprendem com seus erros e acertos; portfolio show-piece.

Conceitos-chave:

Tempo curto força clareza; mostre só o que importa; admita o que não funcionou.

Ver Completo

🏁 Você terminou o curso

Você agora consegue: (1) decidir entre subagent, equipe e sessão; (2) escrever prompts de spawn que funcionam; (3) configurar hooks como quality gates; (4) operar uma equipe em tmux com plan mode; (5) calcular custo e desligar limpo; (6) replicar o padrão em Codex e Gemini.

O próximo passo é levar isso para o seu projeto real e construir o seu primeiro squad de produção.

← Trilha anterior: Diagnóstico Voltar ao início ↑