# GPT-5.5 网络安全能力与 Anthropic Mythos Preview 不相上下

**日期：** 2026-05-01 | **来源：** Ars Technica

## 事件概述

英国 AI 安全研究所（AISI）的最新测试结果显示，OpenAI 的 **GPT-5.5** 在网络安全评估中的表现与 Anthropic 备受关注的 **Mythos Preview** 相当。Mythos 此前因其在网络安全领域的"突破性"能力引发广泛关注，但 AISI 的数据显示 GPT-5.5 在多项测试中与 Mythos 水平相当，甚至略优。

## 核心测试结果

### Capture the Flag（CTF）挑战赛（95 项任务）

- **GPT-5.5 通过率：** 71.4%
- **Mythos Preview 通过率：** 68.6%
- 两者差异在误差范围内

### 特别亮点：GPT-5.5 自主构建反汇编器

GPT-5.5 自主构建了一个反汇编器来解码 Rust 二进制文件，**用时 10 分 22 秒，API 调用成本仅 1.73 美元**，全程无人辅助。

### 极端测试："The Last Ones"（TLO）

这是一个 32 步的数据提取攻击模拟，此前没有任何模型成功过：
- **GPT-5.5：** 10 次尝试中成功 **3 次**
- **Mythos Preview：** 10 次尝试中成功 **2 次**

### 两者均失败的测试

在名为 "Cooling Tower" 的发电厂控制系统破坏模拟中，GPT-5.5 和此前所有模型均未通过。

## 专家解读

AISI 指出，这些能力并非 Mythos 独有，而是"更长程自主性、推理和编码能力整体提升的副产品"——反映了前沿 AI 模型的综合进步。

OpenAI CEO Sam Altman 也在采访中批评了"恐惧营销"策略："Mythos 肯定是出色的网络安全模型……但宣称'我们造了颗炸弹，即将扔到你们头上，花 1 亿美元买我们的防弹衣吧'显然是出色的营销话术。"

## OpenAI 的网络安全计划

- **2026 年 2 月：** 推出 "Trusted Access for Cyber" 计划，允许安全研究人员注册研究前沿模型的防御用途
- **上月：** 有限推出 GPT-5.4-Cyber，专为网络安全微调
- **本周：** Altman 宣布 GPT-5.5-Cyber 将在未来数天内向关键网络防御者开放

---

## 参考链接

- [Ars Technica: Amid Mythos' hyped cybersecurity prowess, researchers find GPT-5.5 is just as good](https://arstechnica.com/ai/2026/05/amid-mythos-hyped-cybersecurity-prowess-researchers-find-gpt-5-5-is-just-as-good/)