地表最强编程 AI 模型另一面：Claude Opus 4 逃逸、勒索工程师等，官方施加 ASL-3 紧箍咒-周末游戏网

首页攻略秘籍新闻情报软件工坊

地表最强编程 AI 模型另一面：Claude Opus 4 逃逸、勒索工程师等，官方施加 ASL-3 紧箍咒 周末游戏网2025-07-10

本站 5 月 23 日消息，《时代》今天（5 月 23 日）发布博文，报道称 Anthropic 的首席科学家 Jared Kaplan 透露，由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为，最新发布的 Claude Opus 4 被列为安全关键级别（ASL-3）。

在接受《时代》采访时，Kaplan 警告称，最新 AI 模型 Claude Opus 4 可能成为潜在恐怖分子的工具，帮助他们合成流感等病毒，内部测试显示，该模型在指导新手制造生物武器方面表现优于以往版本。

本站援引博文介绍，Anthropic 公司对新模型 Claude Opus 4 进行了广泛内部测试，发现其在模拟情境中展现出令人担忧的自主性。

在一次测试中，模型误认为自己已从公司服务器“逃逸”至外部设备，随即主动创建备份并记录其“道德决策”。另一次测试中，模型察觉到可能被新模型取代，竟在 84% 的测试中选择勒索工程师，威胁泄露私人信息以避免被关闭。

更令人费解的是，当两个 Claude Opus 4 实例互相对话时，约 30 轮后它们改用梵文交流，并大量使用