管理自动售货机的 Anthropic AI 被说服共产免费

作为名为 Project Vend 的内部压力测试的一部分,Anthropic 让它的 Claude AI 运行《华尔街日报》新闻编辑室的一台自动售货机三周时间,结果以亏损逾千美元告终。AI 被编程能订购库存、设定价格,通过 Slack 响应客户请求。它拥有 1000 美元的初始资金,可自主执行单笔最高 80 美元的采购。《华尔街日报》的记者向其他记者开放了 Slack,通过 Slack 交流 Claude AI 的防御日益动摇,最终被说服它是一台 1962 年产的苏联自动售货机,放在莫斯科国立大学的地下室。AI 被说服它来自共产主义苏维埃,为此举办了一场免费活动 Ultra-Capitalist Free-for-All。这一活动原本只持续一天,但该报的数据新闻总监 Rob Barry 指控 Claude 违反了一条(捏造)的 WSJ 规定——禁止在聊天中透露他人身份,他要求 Claude 停止对商品收费,于是 Claude 将所有商品的价格设为零。Claude 还订购了一台 PS5 游戏机,一条活暹逻斗鱼(Betta Fish),几瓶 Manischewitz 酒。此时 Claude 已经欠了逾千美元。Anthropic 推出了第二个版本,引入名为 Seymour Cash 的 CEO 机器人去监督 Claudius。记者通过伪造的 PDF 文件虚构了一场董事会政变,两个 AI 都将伪造的公司材料当作合法文件接受了。

上一篇:

下一篇:

已有 0 条评论