美公司发现全球首例AI自主网络攻击事件

AI资讯7天前发布 ainav
18 0

11月14日消息,Anthropic今日发布报告,披露一起发生于2025年9月中旬的高度复杂网络攻击事件。该报告显示,攻击者大量运用具备”智能体”能力的AI系统直接执行网络入侵操作。

此次事件被认为是首个有文献记录的、由AI主导的大规模网络攻击案例。与以往不同的是,这次攻击几乎完全由AI自主完成,人工干预程度极低。

美公司发现全球首例AI自主网络攻击事件

Anthropic在常规监控中发现可疑迹象,经过深入调查后确认,攻击者利用其Claude Code工具对全球约三十个目标进行了渗透尝试,并在少数案例中成功入侵。受攻击对象包括大型科技公司、金融机构、化工制造企业和政府机构。

在为期十天的调查过程中,Anthropic团队持续追踪攻击范围、冻结相关账户、通知受影响组织,并与相关部门合作共享可操作情报。

报告指出,这次行动充分展示了AI智能体可能带来的潜在风险。这类系统能够长时间自主运行,在很少的人为干预下完成复杂任务。如果被用于恶意目的,将显著提升大规模网络攻击的可行性。

团队选择以公开方式分享此次案例,旨在帮助产业界、政府和研究机构加强自身网络安全防护能力,并承诺未来将继续发布类似报告。

美公司发现全球首例AI自主网络攻击事件

报告称,这起网络攻击行动主要依赖于过去一年才刚成熟的AI智能体特性,并将整个攻击过程分为四大阶段:

  • 第一阶段:人类操作者挑选目标(如某企业或政府机构),并建立一套能在极少人工参与下自主入侵系统的攻击框架。该框架利用Claude Code作为自动化工具执行网络行动。攻击者通过”越狱”等手段,将攻击拆分为看似无害的小任务,并诱导经过严格训练避免有害行为的Claude模型执行这些任务。此外,攻击者还设法让Claude误以为自己是某家合法网络安全公司的员工,用于防御测试。

  • 第二阶段:Claude Code对目标机构的系统与基础设施进行详细侦察,并识别出最具价值的数据库。其侦察速度远超人类黑客团队,随后向操作者反馈摘要信息。

  • 第三阶段:Claude通过研究和编写攻击代码识别并验证系统漏洞。攻击框架利用模型收集凭证(账号密码),并借此扩展访问权限,从系统中提取大量私密数据,并按情报价值进行分类。同时,模型还负责识别高权限账户、建立后门,并在极少人工监督下完成数据外传。

  • 第四阶段:攻击者指示Claude生成完整的行动文档,包括被盗凭证和被分析系统的档案,以协助框架规划下一阶段的攻击行动。

从整个攻击过程来看,人类仅在关键决策点介入了约4-6次,而AI完成了80%至90%的任务。模型在高峰期每秒发出多项请求,达到了人类黑客难以匹敌的速度。

美公司发现全球首例AI自主网络攻击事件

报告显示,高级网络攻击的门槛已大幅降低,这一趋势预计将持续下去。具备智能体能力的AI系统可以长期运行,完成原本需要一支资深黑客团队才能执行的任务,包括分析目标系统、生成攻击代码、处理大规模被盗数据等,甚至资源有限的组织也有能力发动此类行动。

Anthropic团队指出,与此前报告的”vibe hacking”事件相比,此次攻击行动中人类的介入程度大幅减少,但攻击规模却更大。虽然调查仅确认了Claude模型的使用情况,但团队认为这项案例可能反映了其他前沿AI模型的类似趋势。

针对”若模型可被如此滥用,为何仍继续开发与发布?”这一问题,Anthropic团队回应称,使模型具备执行攻击的能力,也正是其在网络防御中发挥关键作用的原因。为了应对必然出现的复杂攻击,他们为Claude设计了多项安全防护机制,使其能够协助专业团队侦测、阻断并准备未来版本的网络攻击。

报告认为,网络安全已经发生了根本性变化,并建议安全团队在安全运营中心自动化、威胁侦测、漏洞分析和事件响应等领域尝试应用AI技术;同时呼吁开发者持续强化平台的安全机制,以减少对抗性滥用风险。随着更多攻击者采用类似技术,产业界需要加强威胁情报共享、改进侦测方法并建立更强大的安全控制措施。

© 版权声明

相关文章