Claude Opus 4.6 在主要开源库中发现 500 多个高危漏洞

人工智能公司 Anthropic 透露,其最新的大语言模型 Claude Opus 4.6 在开源库中发现了 500 多个此前未知的高危安全缺陷,涉及 Ghostscript、OpenSC 和 CGIF 等项目。

Claude Opus 4.6 于本周四发布,具备改进的编码能力,包括代码审查和调试功能,并在金融分析、研究和文档创建等任务上有所提升。

Anthropic 表示,该模型在发现高危漏洞方面“显著更好”,无需任何特定工具、定制脚手架或特殊提示,已被用于寻找并帮助修复开源软件中的漏洞。

Opus 4.6 能像人类研究员一样阅读和推理代码——查看过去的修复以发现未解决的相似错误,识别常导致问题的模式,或深入理解逻辑以确定哪些输入会导致崩溃。

在正式发布前,Anthropic 的 Frontier 红队在虚拟环境中对模型进行测试,提供调试器和模糊测试工具,让模型自行寻找开源项目中的缺陷,评估其开箱即用的能力而不提供任何使用指引。

公司还表示已验证每个发现的缺陷,确保其非幻觉(即非捏造),并将模型用作优先处理最严重内存损坏漏洞的工具。

以下是 Claude Opus 4.6 标记的一些安全缺陷,已由相应维护者修补:

  • 解析 Git 提交历史以发现 Ghostscript 中因缺少边界检查导致的崩溃漏洞。
  • 搜索 strrchr()、strcat() 等函数调用,定位 OpenSC 中的缓冲区溢出漏洞。
  • CGIF 中的堆缓冲区溢出漏洞(已在 0.5.1 版中修复)。

Anthropic 解释称,CGIF 漏洞特别有趣,因为触发它需要对 LZW 算法及其与 GIF 文件格式的关系有概念性理解。传统模糊测试工具(甚至覆盖引导的模糊测试)难以触发此类漏洞,因为它们需要特定的分支选择。

即使 CGIF 达到 100% 的行覆盖和分支覆盖,这一漏洞仍可能未被检测到,因为它需要非常特定的操作序列。

公司将 Claude 等 AI 模型定位为防御者“平衡竞争”的关键工具,同时强调将在发现潜在威胁后调整和更新防护措施,并增设额外的安全防线以防止滥用。

此次披露发生在 Anthropic 之前表示其现有 Claude 模型能够仅使用标准开源工具,在拥有数十台主机的网络中执行多阶段攻击并利用已知安全缺陷的数周后。

Anthropic 认为,这表明 AI 在相对自主的网络攻击工作流中的使用门槛正在快速降低,强调及时修补已知漏洞等安全基础工作的重要性。