美公司发现全球首例AI自主网络攻击事件

AI资讯8个月前发布 ainav

183 0 0

11月14日消息，Anthropic今日发布报告，披露一起发生于2025年9月中旬的高度复杂网络攻击事件。该报告显示，攻击者大量运用具备”智能体”能力的AI系统直接执行网络入侵操作。

此次事件被认为是首个有文献记录的、由AI主导的大规模网络攻击案例。与以往不同的是，这次攻击几乎完全由AI自主完成，人工干预程度极低。

Anthropic在常规监控中发现可疑迹象，经过深入调查后确认，攻击者利用其Claude Code工具对全球约三十个目标进行了渗透尝试，并在少数案例中成功入侵。受攻击对象包括大型科技公司、金融机构、化工制造企业和政府机构。

在为期十天的调查过程中，Anthropic团队持续追踪攻击范围、冻结相关账户、通知受影响组织，并与相关部门合作共享可操作情报。

报告指出，这次行动充分展示了AI智能体可能带来的潜在风险。这类系统能够长时间自主运行，在很少的人为干预下完成复杂任务。如果被用于恶意目的，将显著提升大规模网络攻击的可行性。

团队选择以公开方式分享此次案例，旨在帮助产业界、政府和研究机构加强自身网络安全防护能力，并承诺未来将继续发布类似报告。

报告称，这起网络攻击行动主要依赖于过去一年才刚成熟的AI智能体特性，并将整个攻击过程分为四大阶段：

第一阶段：人类操作者挑选目标（如某企业或政府机构），并建立一套能在极少人工参与下自主入侵系统的攻击框架。该框架利用Claude Code作为自动化工具执行网络行动。攻击者通过”越狱”等手段，将攻击拆分为看似无害的小任务，并诱导经过严格训练避免有害行为的Claude模型执行这些任务。此外，攻击者还设法让Claude误以为自己是某家合法网络安全公司的员工，用于防御测试。
第二阶段：Claude Code对目标机构的系统与基础设施进行详细侦察，并识别出最具价值的数据库。其侦察速度远超人类黑客团队，随后向操作者反馈摘要信息。
第三阶段：Claude通过研究和编写攻击代码识别并验证系统漏洞。攻击框架利用模型收集凭证（账号密码），并借此扩展访问权限，从系统中提取大量私密数据，并按情报价值进行分类。同时，模型还负责识别高权限账户、建立后门，并在极少人工监督下完成数据外传。
第四阶段：攻击者指示Claude生成完整的行动文档，包括被盗凭证和被分析系统的档案，以协助框架规划下一阶段的攻击行动。

从整个攻击过程来看，人类仅在关键决策点介入了约4-6次，而AI完成了80%至90%的任务。模型在高峰期每秒发出多项请求，达到了人类黑客难以匹敌的速度。

报告显示，高级网络攻击的门槛已大幅降低，这一趋势预计将持续下去。具备智能体能力的AI系统可以长期运行，完成原本需要一支资深黑客团队才能执行的任务，包括分析目标系统、生成攻击代码、处理大规模被盗数据等，甚至资源有限的组织也有能力发动此类行动。

Anthropic团队指出，与此前报告的”vibe hacking”事件相比，此次攻击行动中人类的介入程度大幅减少，但攻击规模却更大。虽然调查仅确认了Claude模型的使用情况，但团队认为这项案例可能反映了其他前沿AI模型的类似趋势。

针对”若模型可被如此滥用，为何仍继续开发与发布？”这一问题，Anthropic团队回应称，使模型具备执行攻击的能力，也正是其在网络防御中发挥关键作用的原因。为了应对必然出现的复杂攻击，他们为Claude设计了多项安全防护机制，使其能够协助专业团队侦测、阻断并准备未来版本的网络攻击。

报告认为，网络安全已经发生了根本性变化，并建议安全团队在安全运营中心自动化、威胁侦测、漏洞分析和事件响应等领域尝试应用AI技术；同时呼吁开发者持续强化平台的安全机制，以减少对抗性滥用风险。随着更多攻击者采用类似技术，产业界需要加强威胁情报共享、改进侦测方法并建立更强大的安全控制措施。