RRodrigo M. Reis
MétodoRobôsMateriaisBlogSobreTrabalhe comigo
Área do ClienteMaterial grátis
R

Rodrigo Munhoz Reis

Vibecoding com Engenharia. Construir com IA, rápido — mas com rigor de engenheiro.

MétodoRobôsMateriaisBlogSobreTrabalhe comigoÁrea do Cliente
LinkedInInstagram
© 2026 Rodrigo Munhoz Reis. Todos os direitos reservados.Política de Privacidade

Segurança

Se a segurança mora no prompt, não é segurança

O system prompt de uma IA de ponta vazou no GitHub e revelou que a defesa era só texto. A lição pra quem constrói com IA: trava de verdade mora em camadas.

Rodrigo Munhoz Reis· 16 de junho de 2026· 4 min de leitura
Se a segurança mora no prompt, não é segurança

Neste artigo

  • O que aconteceu
  • O que isso revela
  • Por que isso é a sua realidade no vibecoding
  • Onde a segurança mora de verdade
  • A janela encolheu
  • Conclusão

Dia 10 de junho, um pesquisador anunciou que tinha furado as defesas do Fable 5, um dos modelos de IA mais avançados do mundo. Dois dias depois, o governo dos EUA tirou o modelo do ar. Aí veio a parte que interessa pra quem constrói com IA: o system prompt completo do modelo vazou no GitHub — cerca de 120 mil caracteres.

Lendo aquilo, a comunidade descobriu algo desconfortável. Boa parte da segurança do modelo era texto. Instruções em linguagem natural pedindo pra ele se comportar.

O que aconteceu

A linha do tempo, segundo o resumo de notícias de IA do dia:

  • 10/06 — o pesquisador "Pliny the Liberator" divulga um jailbreak: um ataque coordenado com vários agentes, truques de caracteres Unicode pra driblar filtros e uma técnica de "decompor e recompor" (perguntas inofensivas isoladas, montadas depois numa resposta perigosa).
  • 12/06 — o governo dos EUA derruba o Fable 5 globalmente com uma ordem de controle de exportação.
  • Na sequência — vaza o system prompt inteiro, ~120 mil caracteres. É o primeiro vazamento integral de um prompt de segurança de um modelo desse porte.

E a frase da análise técnica que vale o post inteiro:

"A arquitetura de segurança depende fortemente de instruções em linguagem natural embutidas no system prompt, em vez de lógica de recusa codificada no modelo."

Traduzindo: a defesa era um texto longo pedindo "não faça isso". Quando o texto vazou, o atacante ganhou o mapa.

O que isso revela

Instrução não é trava.

Pedir educadamente pra um sistema não fazer algo não é o mesmo que impedir que ele faça. Quando a sua defesa é texto, ela carrega duas fraquezas de nascença:

  1. Pode ser contornada — é só achar a frase certa, o caractere certo, o caminho que a instrução não previu.
  2. Pode vazar — e quando vaza, deixa de ser defesa e vira manual de ataque.

Um laboratório bilionário, com os melhores times de segurança do mundo, tropeçou nisso. A lição não é "a IA é insegura". É onde a segurança estava.

Por que isso é a sua realidade no vibecoding

Você não treina modelos de fronteira. Mas comete o mesmo erro, em escala menor, o tempo todo — principalmente construindo rápido com IA:

  • "Validei no front." A regra que impede o usuário de mandar lixo está só no navegador. E o navegador é do usuário.
  • A chave de API "escondida" no código do cliente. Ela está no bundle. O F12 acha em segundos.
  • Confiar que a API só vai ser chamada "do jeito certo". Quem te garante? O cliente faz a chamada que quiser.
  • A regra de "quem pode ver o quê" na lógica da tela, não no banco.

Tudo isso é segurança que mora no prompt: instrução, não trava. Funciona lindamente — até alguém abrir o capô.

Onde a segurança mora de verdade

A regra é antiga e a notícia só reforçou: o que protege é o que roda no servidor, onde o usuário não alcança. O cliente pede; o servidor decide.

  • Banco fechado por regra. Não importa o que o código do cliente tente — o servidor recusa o que a regra não permite. Isso é trava, não instrução. É o oposto do erro que já derrubou apps inteiros com o banco aberto.
  • Segredos fora do código. Chave de API vive no servidor, nunca no bundle. O passo a passo está aqui.
  • Validação no servidor, sempre. A do front é conveniência pro usuário, não defesa.
  • Revisão com método. Antes de aceitar o que a IA escreveu, passe pelo Protocolo de 5 Camadas — Entender, Ler, Blindar, Testar, Versionar. "Blindar" é exatamente perguntar: essa proteção é trava ou é só texto?

Um teste rápido pra qualquer defesa que você escrever: se ela pode ser lida, copiada ou contornada com jeitinho a partir do navegador, ela não é segurança. É pedido.

A janela encolheu

Tem um agravante de 2026. Com IA dos dois lados — a que constrói e a que ataca —, o tempo entre "subi inseguro" e "fui encontrado" caiu de meses para minutos. A semana em que a IA virou caçadora de falhas mostrou isso na prática. Não dá mais pra contar com "provavelmente ninguém vai notar". Uma IA nota. Automaticamente. Em escala.

E isso importa agora porque construir com IA deixou de ser nicho: metade das empresas já usa ferramentas de IA pra programar, contra um quarto um ano atrás. Mais gente construindo rápido é mais gente subindo defesa de texto pra produção.

Conclusão

O Fable 5 não caiu porque a IA é burra. Caiu porque a defesa estava no lugar errado — num texto que podia ser lido e contornado. O seu app cai pelo mesmo motivo quando a trava mora no cliente, no prompt, na boa vontade do usuário.

Se a defesa pode ser lida, copiada ou pedida com jeitinho, ela é instrução — não segurança. A trava de verdade mora onde o usuário não chega: no servidor.

Quer o método completo pra blindar cada etapa — banco, segredos, deploy — com prompts prontos? Está no e-book gratuito IA Sem Medo, e dá pra começar agora pelos robôs de IA gratuitos.

A decisão é sua.

Próximo passo

Quer aplicar isso com método?

Baixe os guias gratuitos de vibecoding com engenharia e libere os robôs de IA na Área do Cliente — prompts prontos para usar no ChatGPT, Claude ou Gemini.

Baixar guias grátisConhecer os robôs

Continue lendo

Segurança

A IA agora caça (e explora) falhas no seu código — a semana que provou isso

Esta semana, uma IA capaz de achar e explorar vulnerabilidades fez o governo dos EUA reagir, e a Microsoft bateu recorde de falhas corrigidas. O que isso muda pra quem constrói com IA.

Segurança

A IA deixa seu banco de dados aberto por padrão — e 2026 está cheio de provas

Os vazamentos de sistemas feitos com IA em 2026 têm um padrão: a IA monta tudo com a porta destrancada. Os casos reais, os números — e o método para não ser o próximo.

IA & Carreira

Acabou o deslumbramento: 2026 é o ano em que a IA virou infraestrutura

Os analistas marcam a virada do hype pro pragmático — IA saindo das demos e entrando no fluxo de trabalho real. Por que isso é ótimo pra quem tem método (e ruim pra quem só tem a ferramenta).

← Voltar ao blog