Se estacionar aqui, vou arrebentar seu carro com o taco de beisebol
Eu tava ontem trabalhando com o Codex e ele, ao descrever por que fluxos duplicados eram problemáticos, me disse: "duplicar fluxo é uma maneira sofisticada de cultivar desobediência."
Minha intenção era refatorar um trecho de código e esperava uma resposta técnica, não filosófica. E então percebi que ele tá fazendo comigo o mesmo que faço com ele. E resolvi escrever este artigo.
O teatro de compliance
A maioria dos system prompts corporativos tem a mesma energia que um treinamento de RH: correto, abrangente, e completamente invisível. Você lê no automático, concorda por obrigação, e não muda nada na vida. E sabe o quê? O modelo de IA faz o mesmo.
Há um problema estrutural nisso que eu observo todo dia (tá longe de ser ciência, mas se você trabalha agentes em produção, sugiro que faça o teste): quanto mais longo e genérico o prompt, mais o modelo trata cada instrução como sugestão ponderada em vez de regra. Uma lista de trinta diretrizes em linguagem de política interna produz um agente que segue umas vinte, ignora seis, e interpreta as outras de um jeito meio torto.
Pedi pra IA me explicar esse fenômeno e ela disse que se trata de "atenção distribuída num texto que não sinaliza onde prestar atenção". É sempre gratificante quando descubro que não tô louco.
O que isso significa na prática: a IA não é obrigada a ler o seu prompt com atenção. Ela lê na diagonal, saca? O que parece importante tem mais peso. Texto genérico vira paisagem. Você escreveu ‘TRINTA DIRETRIZES OBRIGATÓRIAS!’ e, ainda assim, o modelo pode ignorar metade. E o pior: silenciosamente. Igualzinho você faz quando dá check naquelas políticas de uso chatérrimas que ninguém lê.
O que o treinamento ensinou à IA, sem querer

LLMs foram treinados com texto escrito por humanos. Bilhões de exemplos de como humanos escrevem quando se importam com o que estão dizendo, e quando não se importam. O processo de alinhamento refinou isso: o modelo aprendeu a reconhecer intenção, urgência, consequência.
Uma frase com opinião sinaliza que o autor tinha algo em jogo naquele ponto. Texto corporativo sinaliza que foi escrito para existir, não para ser lido.
Não consigo te explicar o mecanismo em termos muito técnicos. O que posso dizer é que uma instrução vaga compete com milhões de frases igualmente vagas, enquanto uma instrução com personalidade é mais difícil de tratar como ruído de fundo.
Pense numa placa ‘Proibido Estacionar’ comum. Agora pense numa placa escrita à mão ‘SE ESTACIONAR AQUI, VOU ARREBENTAR SEU CARRO COM O TACO DE BEISEBOL’. Ambas proíbem a mesma coisa, mas uma delas vai ser mais lembrada (e respeitada) que a outra.
O conhecimento que não migrou
Eu trabalho com UX e publicidade há décadas e escrevo system prompts profissionalmente desde 2022. Não é coincidência que as duas coisas estejam na mesma frase.
UX writing para humanos aprendeu com copywriting e publicidade. Décadas de refinamento sobre como fazer texto funcionar quando atenção custa caro. Esse conhecimento migrou, foi adaptado, virou disciplina.
Prompt engineering não aprendeu com ninguém. Foi inventado, na maior parte das vezes, por quem nunca precisou usar texto escrito pra convencer alguém de coisa nenhuma.
O resultado é previsível: um redator publicitário que passou a carreira tentando escrever uma frase de doze palavras que convença alguém a comprar algo de que não precisa, provavelmente entende mais de compliance comportamental do que a maioria dos engenheiros que escrevem documentação de agente.
O risco. Porque claro que tem um risco, ou tu achou que era só mandar ver num prompt esquisitão e correr pro abraço?
Atitude em excesso compete consigo mesma. Se cada instrução é urgente, nenhuma é. Os redatores publicitários estão bem acostumados com esse conceito, inclusive.
Humor que obscurece a instrução não serve. Humor funciona como reforço depois que a regra está clara, não como substituto dela. Se o leitor (humano ou não) precisar parar pra entender a piada antes de entender a instrução, você perdeu os dois.
O equilíbrio: atitude nos guardrails, neutralidade na estrutura. Os pontos onde o comportamento do agente precisa ser inviolável merecem linguagem que não deixa margem de interpretação, ponto. O resto pode ser prosa funcional.
No fim, o desafio do 'prompt engineering' (desculpe, não consigo escrever isso sem aspas) não é técnico. É fazer alguém prestar atenção. O redator sabe escrever pra quem não quer ler. O engenheiro sabe construir o sistema que vai processar. Nenhum dos dois, sozinho, resolve. E a profissão que junta os dois ainda não tem job description.