Em resumo
- O GPT-5.5 pode executar ataques cibernéticos sofisticados de forma autônoma, completando uma simulação de rede corporativa de 32 etapas e resolvendo um quebra-cabeça de segurança de 12 horas em unicamente 10 minutos.
- A capacidade cibernética ofensiva da IA está melhorando rapidamente entre os desenvolvedores, com o AISI alertando que novos avanços podem chegar em rápida sucessão.
- Os pesquisadores encontraram um jailbreak que contornou totalmente as grades de segurança do GPT-5.5, disparando alarmes.
Uma sucursal governamental do Reino Unificado descobriu que o mais novo padrão de perceptibilidade sintético da OpenAI pode realizar ataques cibernéticos complexos de forma autônoma – e que resolveu um duelo de engenharia reversa em pouco mais de 10 minutos, o que levou murado de 12 horas para um profissional em segurança humana.
O AI Security Institute (AISI), um órgão de pesquisa do Departamento de Ciência, Inovação e Tecnologia da Grã-Bretanha, publicou descobertas quinta-feira mostrando que o GPT-5.5 está entre os modelos mais fortes que avaliou para capacidades cibernéticas ofensivas, colocando-o quase no mesmo nível do alardeado Claude Mythos da Anthropic.
O relatório descobriu que o GPT-5.5 é o segundo padrão a completar o teste mais exigente do AISI – um ataque simulado de rede corporativa de 32 etapas chamado “Os Últimos” – fazendo isso de forma autônoma em duas de cada 10 tentativas. O primeiro padrão a atingir o marco foi o Claude Mythos Preview da Anthropic, que completou a simulação em três das 10 tentativas.
A simulação de rede corporativa, construída com a empresa de segurança cibernética SpecterOps, exige que um agente encadeie reconhecimento, roubo de credenciais, movimento lateral através de múltiplas florestas do Active Directory, um pivô da cárcere de suprimentos através de um pipeline de CI/CD e, por término, a exfiltração de um banco de dados interno protegido – etapas que a AISI estima que um profissional humano levaria murado de 20 horas.
Talvez o resultado mais impressionante tenha envolvido um quebra-cabeça de engenharia reversa terrivelmente difícil. O GPT-5.5 resolveu o duelo – que exigia reconstruir o conjunto de instruções de uma máquina virtual personalizada, ortografar um desmontador do zero e restaurar uma senha criptográfica por meio de solução de restrições – em 10 minutos e 22 segundos, a um dispêndio de US$ 1,73 em uso de API. Um profissional humano, utilizando ferramentas profissionais, exigiu aproximadamente 12 horas.
Na bateria de tarefas avançadas de segurança cibernética do AISI, o GPT-5.5 alcançou uma taxa média de aprovação de 71,4% no nível mais difícil “Expert”, superando o Mythos Preview com 68,6% por cento e superando significativamente o GPT-5.4 com 52,4%.
As descobertas trazem implicações pontuais para a trajetória mais ampla do desenvolvimento da IA. A AISI concluiu que o desempenho do GPT-5.5 sugere que a rápida melhoria nas capacidades cibernéticas pode ser segmento de uma tendência universal e não de um progressão solitário – e alertou que se as competências cibernéticas ofensivas estiverem a surdir porquê um subproduto de melhorias mais amplas no raciocínio, codificação e peroração autónoma de tarefas, logo novos avanços poderão chegar em rápida sucessão.

O relatório também sinalizou preocupações significativas sobre as grades de segurança do padrão. Os pesquisadores identificaram um jailbreak universal que gerou teor prejudicial em todas as consultas cibernéticas maliciosas testadas, inclusive em ambientes de agente multiturno. O ataque levou seis horas de equipe vermelha especializada para ser desenvolvido. Posteriormente, a OpenAI atualizou sua rima de salvaguarda, embora um problema de feitio tenha impedido a AISI de verificar se a versão final era eficiente.
A AISI alertou que as suas avaliações de capacidade foram conduzidas num envolvente de investigação controlado e não refletem necessariamente o que é alcançável a um utilizador generalidade, observando que as implantações públicas incluem salvaguardas adicionais e controlos de chegada.
O relatório surge num cenário preocupante para a segurança cibernética britânica. O relatório anual do governo do Reino Unificado Pesquisa sobre violações de segurança cibernética também publicado na quinta-feira, descobriu que 43% das empresas sofreram uma violação ou ataque cibernético nos últimos 12 meses.
Em resposta, o governo anunciou £ 90 milhões em novos financiamentos para aumentar a resiliência cibernética e disse que está avançando com a Lei de Segurança e Resiliência Cibernética para proteger serviços essenciais. As autoridades também publicaram orientações instando as organizações a se prepararem para um verosímil aumento nas vulnerabilidades de software recém-descobertas, à medida que a IA acelera o ritmo em que as falhas de segurança podem ser encontradas e transformadas em armas.