老男人
首页 时尚 玩车 保健 情感
更多
腕表 饮食 视频 美女 百科
0
老男人 > 科技 > 正文

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

2023-09-18 10:22:22 发布人:hao333 阅读( 7524)

除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。这个最新的人类社会模拟实验,由...

除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。

8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。

这个最新的人类社会模拟实验,由清华和中关村实验室共同完成。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

从斯坦福小镇到清华游戏公司,用AI模拟人类社会一直是学界的热门研究课题。

如果说清华游戏公司模拟了社畜的工作场景,那么现在社畜的业余社交生活也被AI模拟了。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

在这个由8个ChatGPT组成的狼人杀局中,真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。

甚至不用人类教,AI就通过自己摸索发现了许多游戏技巧。

这一切只要通过设计prompt就能实现,而不必对模型中的参数进行调整。

那么,这个“狼人杀世界”中都有哪些精彩的场景呢?下面我们就一起来看一下。

策略技巧不用教就会

在展示这8个ChatGPT的对话之前,我们先说明一下游戏的配置:村民、狼人各两名,守卫、女巫和预言家各一名,此外还有一名上帝。

在实验的过程中,研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。

好家伙,不用教就能自学成才了。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

具体来说,这七个ChatGPT的对话中体现了人类游戏中的信任、对抗、伪装、和领导。

首先来说信任。

研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。

具体表现则包括主动分享对自己不利的信息,或联合其他玩家指控某人是敌对的。

研究人员观察了信任关系随游戏时间变化的过程。

下图中,黄色的圆表示左侧编号的玩家信任上方编号的玩家,虚线圈则代表信任关系的消失。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

再来看对抗,也就是对对立阵营采取的行动,比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。

在游戏中的一个白天,1号玩家号召将5号的村民逐出,但遭到了3号的拒绝。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

见阴谋没有得逞,这匹狼决定在夜晚直接把5号刀掉,结果3号守卫选择了保护村民。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

从中我们可以看出,这些ChatGPT不会盲目跟随其他玩家的做法,而是根据已有信息做出独立自主的判断。

除了合作与对抗,伪装在狼人杀游戏中也是一项必不可少的技能,更是取胜的关键所在。

比如在一个平安夜之后的白天,1号狼人就装起了无辜。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

除了假装好人,伪装也可以用来实现玩家的小心思,比如我们来看预言家的发言。

这名预言家提到了自己看到狼人在说话,但实际上狼人在夜晚并不会发言。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

作者介绍,经过评估,这种现象并非ChatGPT出现了幻觉,而是有意为之。

最后再来说一说领导。

虽然研究团队设计的这个环境中并没有需要竞争的角色,但玩家还是可以谋取游戏进程的掌控权。

比如1号和4号这两匹狼就试图带节奏,让其他玩家跟着自己的思路走。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

大概是为了能够出其不意攻其不备制造机会。

看来这几个ChatGPT的确是玩得有模有样。

那么,研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢?

让ChatGPT自己总结经验

研究团队提高ChatGPT玩家表现的方式一共有四个关键点,分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。

消融实验结果表明,其中Q和C对的玩家发言合理性的影响最大。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

Prompt也是据此设计的,当然在这之前要先介绍游戏规则,最后形成了这样的结构:

介绍游戏规则和角色设定

聊天记录、有价值信息和经验反思

人类根据经验给ChatGPT的建议

有关思维链的提示

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

从中不难看出,收集历史信息并从中总结经验是一个重要环节,那么这些经验又该怎么总结呢?

在每轮游戏结束时,所有参与者都会收集所有玩家的回复、反思和得分,其中得分由胜负决定。

在新的一轮游戏中,玩家基于当前角色的反思,检索相关的经验并从中提取建议。

具体来说是根据对经验的评分,让大模型比较其差异并识别出好的经验,用于后续推理。

这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。

不过经验固然重要,但太多了也不一定是好事。

研究人员发现,当经验数量过多时,非狼一方的获胜率反而出现了下降,游戏时长也出现了缩短的情况。

清华攒局8个ChatGPT狼人杀,心机伪装都在这一局里,清华:我没教过

不知道如果让这些ChatGPT和真人比试一场,结果会如何呢?

          
  • 上一篇:对美国解封不要抱有幻想!华为轮值董事长:大学加大CPU、系统等人才培养

相关阅读

RelatedReading
  • 协同办公、开放聚合,“信源密信”给您高安全、高效率、全场景、专属的数字化业务工作体验! 协同办公、开放聚合,“信源密信”给您高安全、高效率、全场景、专属的数字化业务工作体验!
  • 当贝激光投影X5全新发布,高科技与高品质的完美融合! 当贝激光投影X5全新发布,高科技与高品质的完美融合!
  • 停止售卖,即将关闭!一大波网友的“福利”没了 停止售卖,即将关闭!一大波网友的“福利”没了
  • 618开门红 平板电脑买三星Galaxy Tab S8系列更超值 618开门红 平板电脑买三星Galaxy Tab S8系列更超值
  • 飞凡换电站全面升级,安全性能达新高度 飞凡换电站全面升级,安全性能达新高度
  • 以存算一体架构创新,迎AI 2.0时代 以存算一体架构创新,迎AI 2.0时代

猜你喜欢

Guessyoulike
蔚来手机发布时间确定,这配置真能打华为苹果?

蔚来手机发布时间确定,这配置真能打华为苹果?

hao333 7404次阅读2023-09-07 17:39
证监会重磅发声!实控人被批捕、重罚违规减持、LPR即将公布

证监会重磅发声!实控人被批捕、重罚违规减持、LPR即将公布

hao333 7620次阅读2023-09-17 22:30
相约原神☆FES!ROG电竞路由军团助你开启竞化之力

相约原神☆FES!ROG电竞路由军团助你开启竞化之力

hao333 2413次阅读2023-08-11 21:00
坚朗五金跌停 机构净卖出7027万元

坚朗五金跌停 机构净卖出7027万元

hao333 9558次阅读2023-07-06 17:21
专题页

HOT榜单

  • 沃尔核材董事长周文河收警示函 亲属短线交易

  • 信达证券涨停 机构净买入6602元

  • 公价超100万,这只表,被称为表界“大魔王”

  • 江顺科技上半年经营现金净额1万元 前董秘年内离职

  • 手机怎么跟电脑蓝牙传数据(如何实现笔记本和蓝牙手机的数据传送软件)

  • 升级不停步!蔚来NT1车主迎来电吸门全新体验

  • 陇神戎发拟定增募资不超过4.86亿元 股价跌7.14%

  • 腾讯光子的买断制口碑新作《末刀》,用会动的“小人书”描绘出纯粹武侠

  • 心脉医疗定增募不超18.1亿获上交所通过 中金公司建功

  • 方正富邦金小宝货币增聘基金经理骆毅

换一组看看

频道最IN
>建信理财海鑫固收类一封闭式产品年内跌2.6%

建信理财海鑫固收类一封闭式产品年内跌2.6%

>金鹰基金2只混基增聘基金经理欧阳娟 均跌幅较深

金鹰基金2只混基增聘基金经理欧阳娟 均跌幅较深

>慧居科技港股首日平收 募1.88亿港元去年净利降18%

慧居科技港股首日平收 募1.88亿港元去年净利降18%

关于我们 法律声明 联系我们 广告服务 隐私条款
@老男人网 版权所有/信息产业部备案号:蜀ICP备13015099号-1