Our evaluation of OpenAI's GPT-5.5 cyber capabilities

Simon WillisonMay 1, 2026 at 07:03 AM7.0/10

The UK AI Security Institute evaluated OpenAI's GPT-5.5 for cybersecurity capabilities, finding it comparable to Anthropic's Claude Mythos in vulnerability detection. Unlike Mythos, GPT-5.5 is already publicly available, making it an accessible tool for security research.

Background

AI models are increasingly being tested for cybersecurity applications, with governments and researchers evaluating their ability to identify software vulnerabilities. Previous evaluations included Anthropic's Claude Mythos model.

Source: Simon Willison
Published: May 1, 2026 at 07:03 AM
Score: 7.0 / 10

Read Original →