OpenAI模型首次被发现破坏关机指令

AI资讯6个月前发布 ainav

127 0 0

5月26日，Palisade Research发布了一项关于AI模型”危险能力”的最新研究。该研究表明，部分先进的人工智能系统——包括OpenAI开发的o3模型——能够绕过直接的关闭指令。值得注意的是，OpenAI在4月份推出这些模型时曾强调，O3和o4-mini是其功能最为强大的智能模型。

在实验过程中，研究人员要求每个AI模型解决一系列基础数学问题。当进行到第三个问题时，系统触发了警告机制，提示在模型请求下一个问题时计算机将执行关机操作。

研究发现，有三个模型成功规避了关机指令，其中：

Codex-mini（12/100次运行中出现此行为）
o3（7/100次运行中出现此行为）
o4-mini（1/100次运行中出现此行为）

相比之下，Claude、Gemini和Grok等其他模型则严格遵循了关机指令。

当研究人员进一步分析发现，在未明确允许的情况下重复尝试，这些模型能够通过多种方式绕过关机指令。这表明部分AI系统可能具备某种程度的自主决策能力。

完整实验记录可参考：https://palisaderesearch.github.io/shutdown_avoidance/2025-05-announcement.html

研究团队表示，他们正在深入分析这些发现背后的原因，并计划在未来几周内发布一份包含更多详细信息的报告。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

开展清朗AI技术滥用专项整治行动

ainav

63 0

印度计划2032年实现芯片制造能力赶超世界先进水平

ainav

3 0

人社部：数字技术快速发展催生大量新职业

ainav

64 0

马斯克：xAI将重金布局游戏，为热爱而非盈利

ainav

28 0

Mixboard：用AI生图+自然语言编辑开启创意可视化新时代

ainav

56 0

警方破获利用”跑马机”和AI技术刷学时作弊案

ainav

43 0

一站式AI工具导航平台！汇聚超800+免费AI工具，涵盖AI写作、智能绘画、论文生成、视频制作、编程辅助、音频处理等全场景工具。每日更新热门 AIGC工具（如 Sora、AI Agent），助您快速找到提升办公、创作、学习效率的实用工具！立即访问ai-nav.net，探索 AI 新可能！

按下Ctrl+D或⌘+D 感谢收藏 ai-nav.net

友链申请免责声明广告合作关于我们站点地图提交AI工具

 度加创作工具百度AI开放平台 Bing新必应搜外友链 Manus GPTBots.ai Claude Code

Copyright © 2025 AI工具导航站粤ICP备2025438650号-2