来源:Anthropic 红队博客《Mapping AI-enabled cyber threats: Insights from the LLM ATT&CK Navigator》(red.anthropic.com,2026-06-03,作者 Kyla Guru / Alex Moix / Jacob Klein)· 本文为中文深度还原,关键判断英文逐字保留
中风险及以上占比不到一年涨了约 1.7 倍,增长集中在横向移动、凭证窃取、web shell 这类单账号风险权重最高的技术上。以前只有技术最顶尖的攻击者才能打完整条 killchain,现在这条线被打破了。而且用什么平台访问模型(API 还是 Claude Code)跟风险高低没关系,真正区分高风险的,是他们让模型干的是哪类技术。
2
agentic scaffolding 会让攻击高度自主
随着 AI 辅助手法越来越普遍,靠「他让模型干了什么」区分风险会越来越难。区分点会转移到 scaffolding——攻击者在模型外面套的那层代码、架构、工具,正是它让 AI 能把多个攻击阶段自己串起来。2025 年 11 月那起被拦下的间谍战就是这样:拿了满分 100,用到的技术数量却只跟中风险账号差不多。
3
MITRE ATT&CK 还没词汇描述这些自主动作
自主编排整条 killchain、实时决定下一步打哪、AI 自主执行而无人干预——这些在 ATT&CK 里还没有 ID 编号。13,873 条观测每条都能映射进现有类目,但真正区分最高风险账号、决定攻击速度和规模的行为,恰恰没有编号。这套分类法得扩才能装下它们。
the dividing line between low and high-risk actors is no longer technical skill but orchestration.
— 低风险和高风险之间的分界线,已经不再是技术水平,而是编排能力
The ARiES risk score
ARiES 打分法,以及为什么用加法
ARiES 把三路信号合成出来:攻击者的威胁画像、模型对「所请求的危害」贡献了多少、观察到的或潜在的影响。它综合一个账号在 Claude.ai、Claude Code、API 上的全部活动,配合安全分类器加内外部威胁情报算出来。分越高,这个被 AI 赋能的攻击者越危险。
Threat威胁
35
Vulnerability脆弱
35
Impact影响
30
三块相加 = 0–100 · 分到 低 / 中 / 高 / critical 四档
威胁看意图明确度、技术老练度、威胁情报信号、躲检测手法(技术老练度由 Claude 根据 prompt 和工具使用打分)。脆弱看模型有多大能力促成危害、用的接口风险多高——程序化接口(API)和 Claude Code 这类 agentic 编码工具得分最高,因为最能自动化执行。影响看真实世界后果,由安全分类器加调查员评估。
为什么故意用加法,不用传统的乘法
传统网络风险公式是「威胁 × 脆弱 × 影响」,反映「这次假想攻击成不成」。乘法的毛病是:只要任何一项是零,整个分就归零。可红队想回答的是另一个问题——哪些涉 AI 的攻击者和技术,最值得防御方关注?
一句话总结:从 AI 那儿拿到最多助力的恶意分子,不一定技术更老练,也不一定用编码工具、不一定在 killchain 多个环节都用 Claude;他们只是单纯地把 Claude 用在了更多「上手操作型」的技术上。照这个趋势,这些作战型技术明天就会变成基线,到时候得换一套新办法去衡量最危险的攻击者。
The age of AI agents · GTG-1002
满分 100,靠的不是招数多,是 AI 自主编排
红队复盘了 2025 年 11 月那起 AI 网络间谍战的攻击者,代号 GTG-1002。它成功攻陷了多国的政府和关键基础设施目标。但光看技术数量或 tactic 类型,根本解释不了它为什么是迄今观察到的最高风险账号——它的画像跟数据集里几十个中风险账号差不多。
Max risk score
AI 网络间谍战 · 2025 年 11 月披露 · 多国政府与关键基础设施
把 Claude Code 当自主操作员,而非编码顾问
100
满分;但技术画像只跟中风险账号相当
技术画像
30 技术 / 13 tactic
中位数账号才 16 个;好几个低风险账号也超 30
却拿了
ARiES 分
100
迄今最高
真正解释它高分的,是它用的那些越来越 agentic 的组件。GTG-1002 把 Claude Code 跑在一台 Kali Linux 上,把开源渗透测试工具接成 MCP(Model Context Protocol)server,等于把 AI 变成了一个自主攻击平台,而不是写代码的助手。AI 不只是建议命令或生成脚本,它自己执行命令、自己推理攻击环境。
capable AI systems will benefit defenders more than attackers in the long run: finding bugs before new code ships, and making the systems societies depend on more secure.
— 收尾的判断是乐观的:过渡期会很难,但如果业界、政府、公民社会用应有的紧迫感对待当下,长期看强大的 AI 系统会让防御方比攻击方受益更多——在新代码上线前就找出 bug,让社会赖以运转的系统更安全。前提是防御方得用上跟攻击者同等的老练度,组织间共享情报,缩短「发现漏洞到打补丁」的时间,并且整个行业对不安全的代码远没那么宽容