前沿人工智能与软件漏洞防御的下一阶段

来源: 博客文章
作者: Mike Milinkovich
发布时间: 2026年5月18日 15:00:00
原文链接: https://blogs.eclipse.org/post/mike-milinkovich/frontier-ai-and-next-phase-software-vulnerability-defence


随着先进人工智能降低了发现和利用软件漏洞的成本,欧洲必须将开源安全与快速补丁部署视为关键的韧性基础设施

背景。 前沿AI系统在网络安全和软件韧性方面已跨越一个重要门槛。它们不再局限于代码补全、分类或报告撰写;目前能力最强的模型已能够协助漏洞发现、可利用性分析,并越来越多地参与补丁生成。Anthropic于2026年4月7日启动的Project Glasswing,通过向选定的关键软件运营者和维护者提前提供Claude Mythos Preview用于防御性安全工作,使这一转变进入公众视野。Anthropic将Glasswing描述为一项借助前沿AI提前介入来保障关键软件安全的倡议,涉及主要基础设施、云服务、金融机构及开源参与者,并向超过40家构建或维护关键软件基础设施的组织开放访问权限。通过我们与Alpha Omega项目的长期合作,Eclipse基金会自项目启动之初便成为Glasswing项目的一部分,让我们直接体验了这种新兴的AI辅助漏洞发现模式。据我们所知,我们是目前唯一参与该项目的欧盟驻地组织,这使我们在前沿AI能力如何开始重塑软件安全与韧性方面拥有独特的观察视角。

为何此刻至关重要。 这一能力跃升似乎并不局限于某一个模型、供应商或生态系统。英国AI安全研究院发现,Claude Mythos Preview在网络性能上实现了阶跃式变化,包括在多步骤攻击模拟上的自主进展以及在专家级网络任务上的高成功率。不到三周后,AISI报告称OpenAI GPT-5.5在其网络评估中达到了类似水平的性能,并且是第二个端到端完成AISI多步骤网络攻击模拟的模型。开放权重模型也在缩小差距:CAISI 2026年5月的评估DeepSeek V4 Pro描述为在其评估范围内(涵盖网络、软件工程、科学、推理和数学)能力最强的中国模型,但相较于美国领先的前沿模型仍有大约八个月的差距。这意味着目前集中在少数前沿AI供应商手中的能力将迅速变得更便宜、更广泛可用且更难治理。这使得早期在机构层面获得前沿防御性AI工作流程的经验具有战略意义。

迫在眉睫的风险:漏洞与补丁之间的失衡。 关键基础设施运营者(包括能源、交通、水务、卫生、公共服务和金融服务)尤其面临风险,因为许多运营者运行着复杂、老旧且不透明的软件资产,其补丁部署过程缓慢、谨慎且会干扰运营。这并非杞人忧天:美国政府GAO 2025年的审查发现,联邦关键遗留系统中存在过时的编程语言、不受支持的硬件或软件,以及支持关键基础设施、税务处理和国家安全的系统中的已知网络安全漏洞。CISA同样警告称,在关键基础设施环境中,过时的软件(包括用于连接运营系统的面向公众的路由器、VPN和防火墙)是威胁行为者入侵的入口。NCSC现在预计将出现一场“漏洞补丁浪潮”:随着AI加速发现长期存在的技术债务,开源和商业软件栈中将涌现大量软件更新。

系统性威胁。 AI辅助的漏洞发现改变了攻击方的经济模式。它降低了发现漏洞、验证可利用性、将已知但未修补的漏洞转化为实际攻击所需的时间、专业知识和成本。当众多机构依赖相同的软件、库、云服务商、身份系统、网络设备或开源软件组件时,这种威胁尤为危险。数十年来,许多IT和运营技术环境将补丁管理视为应尽量减少的运营中断,尤其是在系统看似正常运行时。在某些情况下,这种谨慎可以理解:停机可能带来安全、经济、监管和声誉方面的后果。但风险平衡正在改变。当AI能够加速漏洞发现和利用时,“稳定但未打补丁”的系统可能迅速变得系统性暴露。改变这种文化,使快速、经过充分测试的补丁部署成为核心韧性功能,可能是短期内最艰难的挑战之一。最严重的担忧在于,威胁行为者可能利用AI在补丁发布前发现并利用“零日漏洞”。国际货币基金组织于2026年5月7日警告称,先进AI模型可减少识别和利用漏洞的时间与成本,增加广泛使用系统出现关联故障的可能性;该组织特别将金融中介、支付和信心确定为系统性风险渠道。同样的担忧也适用于金融、能源、电信、公共服务和数字基础设施之间的跨部门依赖关系。

Eclipse基金会的关键发现。 我们在为期一个月的Mythos实验中最重要发现是:操作工作流、验证管道和人工监督至少与模型本身同等重要。Glasswing的真正意义不仅仅在于一个前沿模型发现了更多漏洞,而在于一个安全研究人员社区能够迭代改进提示语、自主代理框架、目标选择方法、复现管道和分类工作流,然后将这些方法应用于多个市场可用的模型,包括更便宜、更容易获取的模型。Anthropic自己的技术报告强化了这一点:其漏洞工作使用了自主代理框架、容器、目标排序、重复运行和验证方法,而非仅靠单纯的聊天机器人提示。NCSC同样强调,实用的人工智能网络能力来自AI系统——模型结合工具、工作流和人工监督——而不仅仅来自原始模型能力。

机遇:机器速度下的共享防御能力。 同样能够提高攻击风险的工具,如果率先且负责任地部署,也能加强防御。AI可以持续扫描代码和依赖关系,生成模糊测试框架,根据可利用性和暴露程度对发现进行优先级排序,提出补丁建议,生成回归测试,为维护者总结影响,并加速协调漏洞披露。NCSC指出三种高价值的防御用途:通过AI支持的测试和加固减少攻击面,改进检测和调查,以及在严格治理下自动化缓解和响应。战略目标应当是让AI驱动的发现转化为AI辅助的修复,速度超过对手将发现转化为利用。不使用AI来加强威胁检测、预防和缓解的组织,有可能被具备AI能力的攻击者超越。

欧洲现在应该做什么。 欧洲应将AI赋能的开源安全视为共享的数字韧性基础设施。这意味着要对支撑关键服务的软件组件进行可信的漏洞发现、协调披露、维护者支持、补丁验证和部署准备的投资。没有任何单一厂商、基金会、机构或成员国能够单独解决这个问题;这需要生态系统层面的响应。欧洲还应确保可信的公共机构和开源生态系统直接参与前沿AI网络安全评估和修复工作,而非依赖欧洲以外的商业行为体。

开源不是问题,而是解决方案。 风险并非来自开源,而在于许多组织依赖的软件,它们既不完全了解,也无法全面清查,更无法快速修补。开源使这种依赖关系变得可见、可审计且可修复。在人工智能驱动的修复生态系统中,开源治理结构将日益重要,因为其透明度、全球维护者社区、可复现构建、公开问题追踪、协调披露实践以及共享安全工具,使其具备在生态系统规模上运作的独特能力。美国网络安全和基础设施安全局(CISA)的开源软件安全路线图明确将开源软件(OSS)视为由多元社区支持的公共产品,并呼吁支持政府和关键基础设施所依赖的关键OSS组件。此外,人工智能正推动反向工程工具日益精进,可从专有二进制文件生成源代码,使得“通过混淆实现安全”的策略不再可行。

结论。 这是一个全球性的软件韧性议题,对欧洲的安全、数字主权和战略自主具有直接影响。世界各地的关键基础设施和金融服务都依赖于全球开发的开源组件、共享平台和通用供应链。本地推动者固然重要,但孤立的各国应对并不足够。当务之急是协调行动:共享人工智能驱动的漏洞发现、可信的披露渠道、维护者支持、快速补丁生产、依赖关系情报,以及跨公私部门的部署能力。归根结底,韧性不仅取决于人工智能能力本身,更取决于能够在共享基础设施上快速协调修复的可信生态系统。Eclipse 基金会将与公共机构、行业和开源社区合作,帮助加强整个欧洲软件生态系统的这些共享韧性能力。最终,韧性将不仅依赖于人工智能能力本身,还依赖于能够在共享基础设施上快速协调修复的可信生态系统。开源不应被视为薄弱环节,而应被视作协调层,通过它,欧洲及其全球伙伴能够以现代韧性所需的速度发现、修复、验证和部署安全改进。