Verificando acesso...

TRILHA 1

Fundamentos

Entenda a lógica do Hermes, do Triad e do sistema multi-modelo de IA

6
Módulos
42+
Tópicos
~5h
Duração
Iniciante
Nível

Mapa da trilha

Conteúdo detalhado

1.1 ~45 min

🤖 O que é Hermes Agent

O agente que aprende com você — persistência, memória e automação em background para ampliar o que você faz.

O que é:

Hermes é um agente com memória persistente e contexto acumulado, diferente de chatbots sem estado que esquecem tudo a cada sessão.

Por que aprender:

Entender essa diferença define como você vai usar a ferramenta — e por que ela entrega resultados melhores com o tempo.

Conceitos-chave:

Memória persistente · Contexto acumulado · Agente vs assistente.

O que é:

Capacidade do agente de manter contexto, decisões e preferências entre diferentes conversas e sessões de trabalho.

Por que aprender:

Sem persistência, você repete instruções toda vez. Com ela, o agente melhora e se adapta continuamente ao seu estilo.

Conceitos-chave:

soul.md · Memória de longo prazo · Aprendizado incremental.

O que é:

Hermes é o agente estratégico com memória do seu negócio. Claude Code é a ferramenta de execução técnica para código e arquivos.

Por que aprender:

Usar cada ferramenta no papel certo maximiza a produtividade e evita desperdício de recursos e tempo.

Conceitos-chave:

Agente estratégico · Executor técnico · Divisão de responsabilidades.

O que é:

Após cada tarefa, Hermes atualiza seu modelo do usuário — preferências, erros, padrões de decisão — para refinar futuras execuções.

Por que aprender:

O agente fica mais preciso com o uso. Entender esse ciclo permite acelerar o aprendizado do sistema.

Conceitos-chave:

Feedback loop · Atualização de memória · Refinamento de contexto.

O que é:

Hermes executa tarefas agendadas sem presença do usuário — relatórios, análises, disparos — e entrega resultados ao acordar.

Por que aprender:

Desbloqueia produtividade assíncrona real. Tarefas pesadas rodam enquanto você dorme ou foca em outras coisas.

Conceitos-chave:

Cron jobs · Agente autônomo · Entrega assíncrona.

O que é:

Hermes constrói um modelo interno do usuário: voz, valores, objetivos, limites e ritmos de trabalho — estruturado no soul.md.

Por que aprender:

É a diferença entre um agente genérico e um que soa como você e age com seus critérios.

Conceitos-chave:

soul.md · Modelo do usuário · Personalização profunda.

O que é:

Exemplos reais de como Hermes é usado: gestão de projetos, criação de conteúdo, análise de negócio, suporte e automação.

Por que aprender:

Casos concretos ajudam a calibrar onde investir o tempo de configuração e qual ROI esperar.

Conceitos-chave:

ROI de agente · Casos de automação · Fluxos de negócio.

1.2 ~40 min

🧠 O problema de um único modelo

Por que múltiplos cérebros importam — viés de confirmação, pontos cegos e o custo de decisões sem revisão.

O que é:

Um modelo treinado de certa forma tende a confirmar suas próprias hipóteses, criando uma câmara de eco nas respostas.

Por que aprender:

Sem entender esse viés, você aceita respostas ruins como verdades e toma decisões baseadas em conclusões viciadas.

Conceitos-chave:

Viés de confirmação · Câmara de eco · Homogeneidade de treinamento.

O que é:

O mesmo modelo que gera uma resposta usa o mesmo conjunto de pesos para avaliá-la — tornando a autocrítica estruturalmente limitada.

Por que aprender:

É a justificativa central para o sistema Triad: revisão cruzada entre modelos diferentes produz qualidade que nenhum modelo solo alcança.

Conceitos-chave:

Autorreferência · Pesos compartilhados · Revisão cruzada.

O que é:

Modelos com arquiteturas diferentes (transformer variants, MoE, RLHF distinto) cometem erros diferentes — e se complementam.

Por que aprender:

Esse princípio fundamenta a escolha de modelos no Triad: não é sobre qual é melhor, mas sobre quem cobre o ponto cego de quem.

Conceitos-chave:

MoE · Diversidade de arquitetura · Complementaridade de erros.

O que é:

Pesquisas como Reflexion (Shinn et al.) e Society of Mind demonstram ganhos mensuráveis de qualidade com sistemas multi-agente e crítica externa.

Por que aprender:

Validar o Triad com evidência científica ajuda a justificar o uso do sistema para equipes e clientes céticos.

Conceitos-chave:

Reflexion framework · Multi-agent debate · Avaliação externa.

O que é:

Decisões estratégicas baseadas em análise de modelo único podem custar meses de trabalho perdido — exemplos reais e como calcular esse risco.

Por que aprender:

Quantificar o custo do erro torna o investimento em sistema multi-modelo óbvio. Uma decisão correta paga o sistema inteiro.

Conceitos-chave:

Custo de erro · ROI de revisão · Análise de risco.

O que é:

WD-40 levou 40 tentativas para funcionar. Loops curtos de execução e crítica criam progresso exponencial em vez de refinamento sem fim.

Por que aprender:

Define o ritmo ideal do Triad: não perfeição na primeira rodada, mas iteração rápida até o SHIP.

Conceitos-chave:

Iteração · Loop curto · Progresso incremental.

O que é:

O Triad coloca três modelos de arquiteturas diferentes em papéis distintos (planejar, executar, criticar) — eliminando o viés de qualquer modelo único.

Por que aprender:

É a conexão direta entre o problema (módulo 1.2) e a solução (módulo 1.3) — entender isso solidifica a lógica do sistema.

Conceitos-chave:

Divisão de papéis · Eliminação de viés · Revisão arquitetural.

1.3 ~50 min

⚡ O Sistema Triad

Planeje, Execute, Critique — o fluxo Condutor → Executor → Crítico que entrega resultados verificados.

O que é:

O Triad é um pipeline de três estágios: Opus planeja e valida, DeepSeek executa com volume, GPT-5.5 critica até aprovação.

Por que aprender:

Entender o fluxo completo antes dos detalhes evita confusão na implementação e deixa claro onde cada modelo entra.

Conceitos-chave:

Pipeline · Três estágios · Separação de responsabilidades.

O que é:

Claude Opus 4 interroga o usuário para entender a tarefa, gera o brief detalhado e valida a entrega final antes do SHIP.

Por que aprender:

A qualidade do brief define o teto do resultado. Opus é caro — mas essa é a etapa que mais impacta a qualidade final.

Conceitos-chave:

Brief · Interrogação estratégica · Validação final.

O que é:

DeepSeek V4 executa o trabalho pesado — texto, código, análise — a uma fração do custo, permitindo múltiplas iterações sem culpa.

Por que aprender:

A economia de custo no executor é o que torna viável o loop de iteração rápida. Sem custo baixo, o sistema não escala.

Conceitos-chave:

Custo por token · Escalabilidade · Volume de iterações.

O que é:

GPT-5.5 avalia a entrega do Executor com critérios específicos do brief, aponta falhas com precisão e decide se aprova ou devolve para revisão.

Por que aprender:

Um crítico de arquitetura diferente captura erros que o Executor jamais veria em si mesmo — é a garantia de qualidade do sistema.

Conceitos-chave:

Critério de aprovação · Feedback específico · Gate de qualidade.

O que é:

Executor e Crítico iteram em loop até que o Crítico aprove — então Opus valida e a entrega vai ao usuário com o selo SHIP.

Por que aprender:

O loop é o coração do sistema. Entender como ele funciona permite calibrar quantas iterações esperar e quando intervir.

Conceitos-chave:

Loop · SHIP · Critério de saída do loop.

O que é:

Usar modelos da mesma família reduziria a diversidade de perspectivas. Diferentes empresas e arquiteturas garantem pontos cegos distintos.

Por que aprender:

É a regra de ouro para montar seu próprio Triad: nunca use dois modelos do mesmo provider no mesmo papel crítico.

Conceitos-chave:

Diversidade arquitetural · Multi-provider · Independência de erros.

O que é:

Walkthrough completo: Opus interroga sobre o negócio, DeepSeek analisa 10 nichos, GPT-5.5 critica e elimina, Opus valida o vencedor.

Por que aprender:

Ver o sistema funcionando de ponta a ponta em um caso real é a forma mais rápida de entender como replicar para outros contextos.

Conceitos-chave:

Caso de uso · Walkthrough · Replicabilidade.

1.4 ~55 min

📄 soul.md

A memória persistente do seu agente — identidade, missão, voz, limites e ritmo estruturados em um único arquivo.

O que é:

Arquivo markdown que centraliza tudo que o agente precisa saber sobre você — identidade, missão, negócio, voz e limites — para agir com autonomia.

Por que aprender:

Sem o soul.md, cada sessão começa do zero. Com ele, o agente já sabe quem você é, o que quer e o que nunca pode fazer.

Conceitos-chave:

Contexto persistente · Arquivo de identidade · Base do agente.

O que é:

Seção que define nome, localização, papel profissional e canais de comunicação — o cartão de visita que contextualiza todas as decisões do agente.

Por que aprender:

O agente usa a identidade para calibrar tom, referências culturais e prioridades. Contexto geográfico e profissional muda tudo.

Conceitos-chave:

Contexto geográfico · Papel profissional · Canais de presença.

O que é:

Seção que define a meta principal do ano, os pilares estratégicos e o que explicitamente está fora de escopo — evitando desvios.

Por que aprender:

O agente filtra oportunidades e sugestões com base na missão. Sem isso, ele propõe coisas irrelevantes para o seu momento.

Conceitos-chave:

OKR · Pilares estratégicos · Fora de escopo explícito.

O que é:

Dados financeiros e operacionais que o agente usa para contextualizar decisões: runway, receita mensal, custos fixos e tamanho de equipe.

Por que aprender:

O agente não pode sugerir contratar pessoas se você tem 2 meses de runway. Contexto financeiro é crítico para recomendações realistas.

Conceitos-chave:

Runway · MRR · Decisão contextualizada.

O que é:

Diretrizes de tom, vocabulário preferido, estilo de escrita e padrões de comunicação — para que o agente escreva como você, não como IA.

Por que aprender:

Conteúdo com voz autêntica performa melhor. O agente que soa como você amplifica sua presença, não dilui sua identidade.

Conceitos-chave:

Tom de voz · Vocabulário · Estilo de escrita.

O que é:

Lista de ações, tópicos e abordagens que o agente nunca pode sugerir ou executar — independentemente do que o usuário peça.

Por que aprender:

Autonomia sem limites é risco. Hard nos protegem sua reputação, seus valores e seus relacionamentos mesmo quando o agente age sem supervisão.

Conceitos-chave:

Guardrails · Limites éticos · Autonomia controlada.

O que é:

Configuração do ritmo semanal: horários de foco, dias dedicados a criação vs. operação, janelas para o agente agir em background.

Por que aprender:

O agente programa tarefas pesadas para os momentos certos — respeitando seu ritmo em vez de interromper no pior momento.

Conceitos-chave:

Deep work · Janelas de foco · Agendamento inteligente.

O que é:

Seção dinâmica do soul.md: decisões importantes, pessoas-chave, ferramentas em uso e lições aprendidas — atualizada pelo agente após cada tarefa relevante.

Por que aprender:

É onde o agente acumula sabedoria sobre o seu contexto. Quanto mais rico, mais preciso e autônomo ele fica com o tempo.

Conceitos-chave:

Memória dinâmica · Contexto acumulado · Melhoria contínua.

1.5 ~35 min

🔀 OpenRouter

Um hub para todos os modelos — uma chave de API, todos os providers, controle total de custo e resiliência automática.

O que é:

Sem um hub, cada modelo exige uma chave diferente, billing separado, rate limits distintos e código de integração específico por provider.

Por que aprender:

Entender o problema torna o valor do OpenRouter imediato. É a diferença entre gerenciar 6 contas e ter uma única interface.

Conceitos-chave:

Fragmentação de API · Overhead operacional · Custo de integração.

O que é:

OpenRouter expõe todos os modelos (Anthropic, OpenAI, DeepSeek, Google...) via uma API compatível com OpenAI — uma única chave, formato padrão.

Por que aprender:

Simplifica radicalmente a implementação do Triad. Troca de modelo = mudar uma string no código, sem refatoração.

Conceitos-chave:

API unificada · Compatibilidade OpenAI · Abstração de provider.

O que é:

Painel unificado que mostra custo por modelo, uso de tokens, gasto por período e alertas de orçamento — tudo em um lugar.

Por que aprender:

Visibilidade de custo é essencial para otimizar o Triad. Saber quanto cada modelo custa permite decisões de roteamento mais inteligentes.

Conceitos-chave:

Custo por modelo · Budget alerts · Otimização de roteamento.

O que é:

Sufixos especiais que instruem o OpenRouter a rotear pela velocidade máxima (:nitro), menor custo (:floor) ou equilíbrio otimizado (:auto).

Por que aprender:

Permite delegar a decisão de provider para o OpenRouter quando velocidade ou custo importam mais do que o modelo específico.

Conceitos-chave:

:nitro · :floor · :auto · Roteamento inteligente.

O que é:

BYOK permite usar sua própria chave do provider (ex: DeepSeek diretamente) dentro do OpenRouter — pagando o preço original sem markup.

Por que aprender:

Para o Executor DeepSeek que roda em loop, BYOK elimina qualquer markup do hub — maximizando a economia de custo do Triad.

Conceitos-chave:

BYOK · Markup zero · Preço direto do provider.

O que é:

Configuração de modelos alternativos que assumem automaticamente se o modelo primário estiver fora do ar ou com rate limit.

Por que aprender:

Agentes autônomos não podem parar porque um modelo teve outage. Fallbacks garantem continuidade sem intervenção humana.

Conceitos-chave:

Fallback chain · Resiliência · Alta disponibilidade.

O que é:

OpenRouter não cobra por completion — lucra com o spread entre providers. Para o usuário com BYOK, o custo é essencialmente o preço do provider.

Por que aprender:

Entender o modelo de negócio do hub permite calcular o custo real do Triad e projetar gastos com precisão.

Conceitos-chave:

Modelo de pricing · Spread de provider · Custo total do Triad.

1.6 ~40 min

🚀 DeepSeek V4

O executor de alto desempenho e baixo custo — 95% do valor por 1% do preço, e por que isso muda o jogo.

O que é:

DeepSeek V4 combina arquitetura MoE com treinamento eficiente para entregar capacidades frontier a uma fração do custo dos modelos ocidentais.

Por que aprender:

Entender a origem da eficiência do DeepSeek ajuda a saber quando usá-lo com confiança e quando um modelo diferente é necessário.

Conceitos-chave:

MoE · Eficiência de treinamento · Custo por capacidade.

O que é:

Comparação de desempenho em MMLU, HumanEval, MATH e benchmarks de raciocínio — DeepSeek V4 vs. GPT-4o, Claude Sonnet e Gemini Pro.

Por que aprender:

Benchmarks concretos eliminam a desconfiança em relação a modelos desconhecidos e estabelecem expectativas realistas de performance.

Conceitos-chave:

MMLU · HumanEval · Comparação de benchmarks.

O que é:

Análise quantitativa: tarefas onde DeepSeek entrega 95%+ da qualidade de GPT-4o a menos de 1% do custo — com exemplos concretos.

Por que aprender:

Essa aritmética é o argumento mais poderoso para adotar o Triad. Um sistema mais barato que entrega mais qualidade é irrecusável.

Conceitos-chave:

Análise custo-benefício · Qualidade por token · ROI de modelo.

O que é:

Comparação direta de preço por milhão de tokens entre DeepSeek V4 e modelos premium — mostrando o impacto em loops de iteração intensivos.

Por que aprender:

Para o loop interno do Triad que pode rodar 10-20 iterações, essa diferença transforma $750 em $8,70 — viabilizando uso intensivo diário.

Conceitos-chave:

Custo por milhão de tokens · Impacto no loop · Viabilidade de escala.

O que é:

Custo baixo remove a fricção psicológica de iterar. Com DeepSeek, você deixa o loop rodar 50 vezes sem ansiedade com a fatura no fim do mês.

Por que aprender:

O comportamento muda quando o custo desaparece da equação. Mais iterações = mais qualidade = melhores resultados de negócio.

Conceitos-chave:

Fricção de custo · Iteração sem limite · Mudança de comportamento.

O que é:

Guia prático: DeepSeek brilha em redação, código, análise e síntese. Evitar para tarefas que exigem raciocínio de última camada ou nuances culturais específicas.

Por que aprender:

Usar o modelo certo para cada tarefa maximiza qualidade e economia. Errar na escolha compromete o resultado do loop inteiro.

Conceitos-chave:

Tarefas ideais · Limitações · Seleção de modelo.

O que é:

Como DeepSeek recebe o brief do Condutor, executa o trabalho e entrega para o Crítico revisar — e como esse fluxo se parece na prática.

Por que aprender:

Fecha o ciclo da Trilha 1: você entende agora cada peça (Hermes, Triad, soul.md, OpenRouter, DeepSeek) e como elas se encaixam.

Conceitos-chave:

Papel de executor · Integração no Triad · Visão completa do sistema.

← Voltar ao Curso Trilha 2: Implementação Técnica →