OpenAI Lança Modo Lockdown para Proteger o ChatGPT Contra Ataques de Prompt Injection
A OpenAI introduziu o Modo Lockdown para o ChatGPT, uma nova camada de segurança projetada para mitigar os riscos associados a ataques de prompt injection. Este modo restringe funcionalidades para impedir a exfiltração de dados confidenciais, focando inicialmente em usuários empresariais e profissionais.
MundiX News·09 de junho de 2026·4 min de leitura·👁 8 views
A OpenAI, pioneira em inteligência artificial, anunciou o lançamento do seu mais recente recurso de segurança: o Modo Lockdown (Lockdown Mode). Esta funcionalidade foi desenvolvida com o objetivo principal de reduzir significativamente o risco de vazamento de informações através de ataques de prompt injection. Ataques de prompt injection ocorrem quando agentes maliciosos inserem instruções ocultas em conteúdos, como documentos ou páginas web, com a intenção de manipular o comportamento de modelos de IA.
Atualmente, o Modo Lockdown está sendo gradualmente disponibilizado para proprietários de contas pessoais do ChatGPT, incluindo usuários do plano gratuito, e também para assinantes do ChatGPT Business. A OpenAI enfatiza que o modo ainda não é destinado ao público em geral, mas sim a organizações e profissionais que necessitam de uma camada adicional de proteção contra potenciais vazamentos de dados. Os ataques de prompt injection são reconhecidos como um dos desafios mais prementes para os sistemas de IA modernos. As instruções maliciosas ocultas podem levar os agentes de IA a revelar informações confidenciais ou a executar ações indesejadas. A OpenAI reconhece que a erradicação completa deste problema ainda é um objetivo em andamento, e a empresa continua a implementar defesas em múltiplas camadas, abrangendo modelos, produtos e infraestrutura.
O Modo Lockdown visa especificamente dificultar a fase final desses ataques: a exfiltração de dados para fora do sistema. Para alcançar isso, o modo impõe restrições severas às interações de rede que poderiam ser exploradas para transmitir informações a atacantes. Uma vez ativado, o ChatGPT perde acesso a diversas funcionalidades. Notavelmente, recursos como Deep Research e Agent Mode são desativados. A funcionalidade de busca na web é colocada em um modo restrito, utilizando apenas conteúdo previamente armazenado em cache. Adicionalmente, o ChatGPT fica impedido de baixar arquivos da internet para análise, de obter imagens online e tem seu acesso a serviços externos e conectores severamente limitado. No entanto, a geração de imagens e o upload manual de arquivos permanecem disponíveis. É importante notar que o Modo Lockdown não desativa a memória do ChatGPT, não altera os parâmetros de treinamento com dados do usuário e não impacta o funcionamento do Codex. A OpenAI reitera que o Modo Lockdown não protege contra a ocorrência dos próprios prompt injections nem impede que eles sejam incluídos no conteúdo processado. Se um prompt malicioso já estiver presente em um documento carregado ou em conteúdo web, ele ainda poderá influenciar o comportamento do modelo. A nova proteção serve primariamente para diminuir a probabilidade de que os atacantes consigam extrair dados do sistema.
A OpenAI, pioneira em inteligência artificial, anunciou o lançamento do seu mais recente recurso de segurança: o Modo Lockdown (Lockdown Mode). Esta funcionalidade foi desenvolvida com o objetivo principal de reduzir significativamente o risco de vazamento de informações através de ataques de prompt injection. Ataques de prompt injection ocorrem quando agentes maliciosos inserem instruções ocultas em conteúdos, como documentos ou páginas web, com a intenção de manipular o comportamento de modelos de IA.
Atualmente, o Modo Lockdown está sendo gradualmente disponibilizado para proprietários de contas pessoais do ChatGPT, incluindo usuários do plano gratuito, e também para assinantes do ChatGPT Business. A OpenAI enfatiza que o modo ainda não é destinado ao público em geral, mas sim a organizações e profissionais que necessitam de uma camada adicional de proteção contra potenciais vazamentos de dados. Os ataques de prompt injection são reconhecidos como um dos desafios mais prementes para os sistemas de IA modernos. As instruções maliciosas ocultas podem levar os agentes de IA a revelar informações confidenciais ou a executar ações indesejadas. A OpenAI reconhece que a erradicação completa deste problema ainda é um objetivo em andamento, e a empresa continua a implementar defesas em múltiplas camadas, abrangendo modelos, produtos e infraestrutura.
O Modo Lockdown visa especificamente dificultar a fase final desses ataques: a exfiltração de dados para fora do sistema. Para alcançar isso, o modo impõe restrições severas às interações de rede que poderiam ser exploradas para transmitir informações a atacantes. Uma vez ativado, o ChatGPT perde acesso a diversas funcionalidades. Notavelmente, recursos como Deep Research e Agent Mode são desativados. A funcionalidade de busca na web é colocada em um modo restrito, utilizando apenas conteúdo previamente armazenado em cache. Adicionalmente, o ChatGPT fica impedido de baixar arquivos da internet para análise, de obter imagens online e tem seu acesso a serviços externos e conectores severamente limitado. No entanto, a geração de imagens e o upload manual de arquivos permanecem disponíveis. É importante notar que o Modo Lockdown não desativa a memória do ChatGPT, não altera os parâmetros de treinamento com dados do usuário e não impacta o funcionamento do Codex. A OpenAI reitera que o Modo Lockdown não protege contra a ocorrência dos próprios prompt injections nem impede que eles sejam incluídos no conteúdo processado. Se um prompt malicioso já estiver presente em um documento carregado ou em conteúdo web, ele ainda poderá influenciar o comportamento do modelo. A nova proteção serve primariamente para diminuir a probabilidade de que os atacantes consigam extrair dados do sistema.