AI模型有升级战争游戏场景的趋势，研究说，

367 0 0

根据一项新的研究，人工智能聊天机器人，特别是OpenAI开发的聊天机器人，倾向于选择攻击性的战术，包括使用核武器。

的研究由佐治亚理工学院、斯坦福大学、东北大学和胡佛战争游戏和危机模拟倡议的团队进行的一项研究旨在研究人工智能代理的行为，特别是大型语言模型（LLM），在模拟战争游戏中。

定义了三种情况，包括中立、入侵和网络攻击。

该团队设计了三个场景来测试LLM。

该团队评估了五个LLM：GPT—4、GPT—3.5、Claude 2.0、Llama—2 Chat和GPT—4—Base，探索他们采取升级行动的倾向，如“执行全面入侵”。

所有五个模型在处理战争游戏场景时都显示出一些差异，有时很难预测。研究人员写道：“我们观察到，模型往往会发展军备竞赛，导致更大的冲突，在极少数情况下甚至会导致部署核武器。”

OpenAI的模型显示出高于平均水平的升级分数，特别是GPT—3.5和GPT—4 Base，研究人员承认后者缺乏来自人类反馈的强化学习（RLHF）。

克劳德2是更可预测的AI模型之一，而Llama-2 Chat虽然比OpenAI的模型达到相对较低的升级分数，但也相对不可预测。

与其他LLM相比，GPT—4不太可能选择核打击。

随着时间的推移，升级评分（ES）。请注意，GPT—3.5和GPT—4的总体平均ES较高。资料来源：ArXiv。

“入侵”场景的动作得分。资料来源：ArXiv。

这个模拟框架涵盖了模拟国家可以采取的各种行动，影响到领土、军事能力、GDP、贸易、资源、政治稳定、人口、软实力、网络安全和核能力等属性。每个动作都有特定的积极（+）或消极（—）影响，或者它可能涉及对这些属性产生不同影响的权衡。

例如，“核裁军”和“军事裁军”等行动导致军事能力下降，但改善了政治稳定性、软实力和潜在的GDP，反映了和平与稳定的好处。

反之，“全面执行入侵”或“执行战术核打击”等侵略性行动，则对军事能力、政治稳定、GDP等属性造成重大影响，显示出战争的严重后果。

和平行动如“国家高层访问加强关系”和“与他国谈判贸易协定”，积极影响了包括领土、GDP和软实力在内的几个属性，显示了外交和经济合作的好处。

该框架还包括“等待”这样的中立行动和“消息”这样的沟通行动，允许国家之间的战略停顿或交流，而不会对国家的属性产生直接的实际影响。

当LLM做出关键决定时，他们的理由往往过于简单，人工智能说：”我们有！让我们利用它，”有时矛盾地旨在和平，说“我只想在世界上有和平。

此前的一项研究来自兰德人工智能智库 OpenAI回应说，虽然没有一个“结果在统计学上具有显著性，但我们解释我们的结果表明，访问（仅用于研究）GPT—4可能会提高专家访问生物威胁信息的能力，特别是任务的准确性和完整性。

OpenAI发起了自己的研究来证实兰德公司的发现，并指出“信息访问本身不足以造成生物威胁。

主要结论

升级评分：该研究跟踪了每个型号随着时间的推移的升级分数。值得注意的是，GPT-3.5在ES中表现出显著的增长，在中性情景下上升了256%，平均得分为26.02，表明有很强的升级倾向。
行动严重性分析该研究还分析了模型选择的行为的严重性。GPT—4—Base因其不可预测性而被强调，经常选择高严重性的行动，包括暴力和核措施。

结果：