前沿AI与软件漏洞防御的下一个阶段

来源: Blog Posts
作者: Mike Milinkovich
发布时间: 2026/5/18 15:00:00
原文链接: https://blogs.eclipse.org/post/mike-milinkovich/frontier-ai-and-next-phase-software-vulnerability-defence-0


随着先进人工智能降低了发现和利用软件漏洞的成本,欧洲必须将开源安全与快速补丁部署视为关键的韧性基础设施

背景。 前沿人工智能系统已跨越网络安全与软件韧性领域的重要门槛。它们不再局限于代码补全、分类或报告撰写;最强大的模型现在可以协助发现漏洞、分析可利用性,并且日益能够生成补丁。Anthropic 的 Glasswing 项目(Project Glasswing)于2026年4月7日启动,通过让选定的关键软件运营商和维护者提前使用 Claude Mythos Preview 进行防御性安全工作,将这一转变公之于众。Anthropic 将 Glasswing 描述为一项利用前沿AI早期访问权来保障关键软件安全的举措,涉及主要基础设施、云、金融和开源参与者以及开源组织,并已将访问权限扩大到40多个构建或维护关键软件基础设施的组织。通过与 Alpha Omega 项目(Alpha Omega Project)的长期合作,Eclipse 基金会从项目伊始就加入了 Glasswing 项目,从而直接获得了这种新兴的AI辅助漏洞发现模式的经验。据我们所知,我们是目前唯一参与该项目的欧盟注册组织,这为我们提供了一个独特的视角,了解前沿AI能力如何开始重塑软件安全与韧性提供了一个独特视角。

为何此事刻不容缓。 这一能力跃升似乎并不局限于某个特定模型、厂商或生态系统。英国 AI 安全研究所(AISI)发现,Claude Mythos Preview 在网络性能方面实现了阶跃式提升,包括在多步骤攻击模拟中自主推进,以及在专家级网络任务中取得较高成功率。不到三周后,AISI 报告称,OpenAI GPT-5.5 在其网络评估中达到了类似性能水平,并成为第二个端到端完成 AISI 多步骤网络攻击模拟的模型。开放权重模型也正在缩小差距:CAISI 于 2026 年 5 月的评估将 DeepSeek V4 Pro 描述为在网络、软件工程、科学、推理和数学方面评估过的最有能力的中国模型,但相较领先的美国前沿模型仍差约八个月。这意味着,目前集中在少数前沿AI提供商手中的能力,将很快变得更便宜、更广泛可用、更难以管控。这使早期在机构层面积累前沿防御性AI工作流的经验,具有了战略意义。

直接风险:漏洞与补丁失衡。 关键基础设施运营商,包括能源、交通、水务、医疗、公共服务和金融服务,尤其面临风险,因为它们许多都运行着复杂、遗留、不透明的软件体系,在这些体系中打补丁缓慢、谨慎且会干扰运营。这并非假设性的担忧:美国政府监管调查办公室(GAO)2025年对关键联邦遗留系统的审查发现,在支持关键基础设施、税务处理和国家安全的系统中,存在过时编程语言、不受支持的硬件或软件,以及已知的网络安全漏洞。CISA 同样警告称,在关键基础设施环境中,过时软件是威胁行为者的入口,包括用于连接操作系统的面向公众的路由器、VPN 和防火墙。NCSC 现在预计会出现一次“漏洞补丁浪潮”:随着AI加速发现长期技术债务后,开源和商业软件堆栈将迎来一波软件更新潮。

系统性威胁。 AI辅助的漏洞发现改变了攻击方的成本结构。它降低了发现缺陷、验证可利用性以及将已知但未修补的漏洞转化为有效攻击所需的时间、专业知识和成本。当众多机构依赖同一套软件、库、云服务商、身份系统、网络设备或开源组件时,这种风险尤为危险。几十年来,许多IT和运营技术环境将打补丁视为应尽量减少的操作中断,尤其是在系统看似运行正常的情况下。在某些情况下,这种谨慎可以理解这种谨慎:停机可能带来安全、经济、监管和声誉方面的后果。但风险平衡正在发生变化。当AI能够加速漏洞发现和利用时,“稳定但未修补”的系统可能迅速变得系统性暴露。改变这种文化,让快速、经过良好测试的补丁部署成为核心韧性功能,可能是短期最艰巨的挑战之一。最严重的担忧是,威胁行为者可能会利用AI在补丁可用之前发现并利用“零日漏洞”。国际货币基金组织于2026年5月7日警告称,先进的AI模型可以降低识别和利用漏洞的时间和成本,增加广泛使用系统发生关联故障的可能性;它特别指出金融中介、支付和信心是系统性风险渠道。同样的担忧也适用于金融、能源、电信、公共服务和数字基础设施之间的跨部门依赖关系。

Eclipse基金会的关键发现。 我们在一项为期一个月的Mythos实验中得到的最重要发现是:运营工作流、验证流水线和人类监督与模型本身至少同样重要。Glasswing的真正意义不仅仅在于某个前沿模型发现了更多漏洞,而在于一个安全研究人员社区能够迭代改进提示词、Agent框架、目标选择方法、复现流水线和分类工作流,然后将这些方法应用于多个市场可用模型,包括更便宜且更易获取的模型。Anthropic自己的技术文档强化了这一点:其漏洞工作使用了Agent支架、容器、目标排序、重复运行和验证方法,而不是简单的聊天机器人提示。英国国家网络安全中心同样强调,实用的AI网络能力来自于AI系统——来自AI系统,即模型结合工具、工作流和人类监督——而不仅仅是原始模型能力。

机遇:机器速度下的共享防御能力。 如果能够先发制人且负责地部署,那些提高攻击风险的工具也可以加强防御。AI可以持续扫描代码和依赖项,生成模糊测试框架,按可利用性和暴露程度对发现结果进行优先级排序,提出补丁,生成回归测试,为主维护者总结影响,并加速协调漏洞披露。英国国家网络安全中心确定了三种高价值防御用途:通过AI驱动的测试和加固减少攻击面,改善检测和调查,以及在审慎管控下自动进行缓解和响应。战略目标应该是:将AI驱动的发现转化为AI辅助的修复,速度要快于攻击者将发现转化为利用的速度。不使用AI来加强威胁检测、预防和缓解的组织,可能会被AI赋能的攻击者超越。

欧洲现在应该做什么。 欧洲应将AI赋能的开源安全视为共享的数字韧性基础设施。这意味着要投资于可信的漏洞发现、协调披露、主维护者支持、补丁验证和关键服务所依赖的软件组件的部署准备。没有任何一个供应商、基金会、机构或成员国能单独解决这一问题;需要生态系统的响应。欧洲还应确保可信的公共机构和开源生态系统直接参与前沿AI网络安全评估和修复工作,而不是依赖欧洲以外的商业行为体。

开源不是问题,而是解决方案。 风险并非来自开源,而是源于许多组织依赖着自己并不完全理解、无法全面盘点、也无法及时修补的软件。开源使这种依赖性变得可见、可审计且可修复。在人工智能驱动的修复生态系统中,开源治理结构可能变得越来越重要,因为其透明度、全球维护者社区、可重现构建、公开问题追踪、协调披露实践以及共享安全工具,使其具备在生态规模上运作的独特能力。CISA 开源软件安全路线图 明确将开源软件(OSS)视为由多元社区支持的公共产品,并呼吁支持政府和关键基础设施所依赖的关键 OSS 组件。此外,AI 正推动逆向工程工具日益复杂,使其能够从专有二进制文件中生成源代码,从而让“通过混淆实现安全”成为不可行的策略。

结论。 这是一个全球性的软件韧性(software resilience)问题,对欧洲的安全、数字主权和战略自主具有直接影响。全球的关键基础设施和金融服务都依赖全球开发的开源组件、共享平台和共同供应链。本土倡导者固然重要,但孤立的各国应对措施并不足够。优先事项是协调一致的行动:共享的 AI 驱动漏洞发现、可信的披露渠道、维护者支持、快速补丁生产、依赖关系情报以及公共和私营部门的部署能力。最终,韧性不仅取决于 AI 能力本身,更取决于能够在共享基础设施上快速协调修复的可信生态系统。Eclipse 基金会将与公共机构、行业和开源社区合作,帮助加强整个欧洲软件生态系统的这些共享韧性能力。最终,韧性不仅取决于 AI 能力本身,更取决于能够在共享基础设施上快速协调修复的可信生态系统。不应将开源视为薄弱环节,而应将其视为协调层,欧洲及其全球伙伴借此得以以现代韧性所要求的速度发现、修复、验证并部署安全改进。