老男人
首页 时尚 玩车 保健 情感
更多
腕表 饮食 视频 美女 百科
0
老男人 > 科技 > 正文

MIT最新研究:多个AI协作有助提高大模型推理能力和准确性

2023-09-20 16:42:10 发布人:hao333 阅读( 4763)

·麻省理工学院计算机科学与人工智能实验室研究团队发现,多个语言模型协同工作胜过单一模型,多个AI协作有助于提高大型语言模型的推理能力和事实准确性。...

·麻省理工学院计算机科学与人工智能实验室研究团队发现,多个语言模型协同工作胜过单一模型,多个AI协作有助于提高大型语言模型的推理能力和事实准确性。

·每个语言模型都生成对给定问题的回答,然后整合来自其他代理的反馈,以更新自己的回应。最终,多个模型的解决方案通过投票达成一致的最终输出。这一过程有点像小组讨论。

MIT最新研究:多个AI协作有助提高大模型推理能力和准确性

一种新颖的方法允许多种语言模型进行协作,经过多轮辩论,最终得出统一且精确的响应。/图片来源:Alex Shipps/MIT CSAIL,来自Midjourney

当地时间9月18日,麻省理工学院计算机科学与人工智能实验室的团队在其官网更新了一项研究:发现多个语言模型协同工作胜过单一模型,多个AI协作有助于提高大型语言模型的推理能力和事实准确性。

俗话说“三个臭皮匠,顶个诸葛亮”。简单而言,这项研究利用多个AI系统互相协作,以协商、辩论的方式以达成对给定问题的最佳答案。这种方法提高了大语言模型对事实数据的依从性和改进决策的能力。

大型语言模型长期存在的问题之一是,其生成的回答不一致,可能有不准确和错误的推理。而新方法允许每个智能体积极评估其他智能体的回答,并利用这些集体反馈来完善自己的回答。

这一过程包括多轮的回应生成和批判,每个语言模型都生成对给定问题的回答,然后整合来自其他代理的反馈,以更新自己的回应。最终,多个模型的解决方案通过投票达成一致的最终输出。这一过程有点像小组讨论,个体一起努力达成一致和合理的结论。

这一技术的一个显著优点在于,它可以无缝应用于现有的“黑匣子”模型,因为这个方法基于生成出的文本,而无需明晰其内部工作原理。CSAIL团队表示,这种简化可以帮助研究人员和开发者改进各种语言模型输出的一致性和事实准确性。

“我们不仅仅依赖于单一的AI模型来提供答案,相反,我们让众多的AI模型参与,每个模型都带来独特的见解以解决问题。尽管它们的初始回应可能显得简单或包含错误,但这些模型可以通过审查其同行提供的回应来改进和提高自己的回答。”麻省理工学院电气工程和计算机科学博士生、CSAIL附属成员以及论文的首席作者之一Yilun Du说道。

根据Yilun Du的个人主页,他目前正在攻读博士,此前已获得麻省理工学院学士学位,曾在ChatGPT的开发机构OpenAI担任研究员,在Facebook人工智能研究所和Google Deepmind担任实习生和访问研究员,并在国际生物奥林匹克竞赛中获得金牌。有趣的是,他曾在TED发表题为《为什么机器人需要梦想》的演讲。

“当这些AI模型参与对话和思考时,它们更能够识别和纠正问题,增强解决问题的能力,并更好地验证其回应的准确性。基本上,我们正在创造一种迫使它们深入问题核心的环境。这与单一的孤立的AI模型形成对比,后者经常复制互联网上找到的内容。然而,我们的方法积极刺激了AI模型制定更准确和全面解决方案的能力。”Yilun Du说。

此项研究涉及数学问题的解决,包括小学和初高中的数学问题,并通过多智能体辩论显著提高了性能。该方法还可以帮助解决经常困扰大语言模型的“幻觉”问题。通过设计这样的环境,智能体之间可以批判对方的回应,更有动力避免随机生成信息并优先考虑事实准确性。

除了应用于语言模型,该方法还可以用于整合具有专门能力的不同模型。通过建立一个多智能体相互交互和辩论的去中心化系统,它们可以潜在地在语音、视频或文本等各种模式下提高问题解决能力。不过研究人员表示,当处理非常长的上下文时,现有的语言模型可能面临挑战,批判能力可能表现得不如预期。

此外,多智能体辩论形式尚未包括有助于智能集体决策的更复杂形式的讨论。据研究团队透露,这正将是未来探索的关键领域。推进这项技术可能需要更深入地了解人类辩论和讨论背后的计算基础,并使用这些模型来增强或补充现有的大语言模型。

Yilun Du认为,随着研究人员继续完善和探索这种方法,人们可以更接近一个未来,在这个未来,语言模型不仅模仿人类语言,还表现出更系统化和可靠的思维,开创语言理解和应用的新时代。

“利用审议过程来改善模型的整体输出非常有道理,这是从思维链的提示中迈出的一大步。”加利福尼亚大学伯克利分校电气工程与计算机科学系副教授、未参与该项工作的安卡·德拉甘说,“我对接下来的发展感到兴奋。当人们看到辩论时,他们是否能更好地判断大语言模型的答案?人们是否通过自己与大语言模型辩论来得出更好的答案?是否可以使用类似的思想来帮助用户审查大语言模型给出的答案,以得出更好的答案?”

          
  • 上一篇:博主:A17 Pro算是彻底拉了,芯片人才被高通挖完了?

  • 下一篇:探寻神经疾病成因:科学家观测蛋白质集聚首次突破纳米级

相关阅读

RelatedReading
  • 超12000次模拟碰撞 联想方案服务助推吉利新车研发 超12000次模拟碰撞 联想方案服务助推吉利新车研发
  • 青少年智慧交锋,探索未来编程之星,ICode国际青少年编程中国区决赛精彩绽放 青少年智慧交锋,探索未来编程之星,ICode国际青少年编程中国区决赛精彩绽放
  • 张勇发文回应老用户不适:哪吒汽车补偿计划揭秘 张勇发文回应老用户不适:哪吒汽车补偿计划揭秘
  • 一个成熟的中年人,从学习向上管理父母开始 一个成熟的中年人,从学习向上管理父母开始
  • AITO问界M7新款明日上市,预售价25.8万元起 AITO问界M7新款明日上市,预售价25.8万元起
  • 母亲节送什么礼物最适合?2023母亲节礼物就选当贝D5X Pro 母亲节送什么礼物最适合?2023母亲节礼物就选当贝D5X Pro

猜你喜欢

Guessyoulike
收评:沪指全天高位震荡涨1.81% 银行板块领涨

收评:沪指全天高位震荡涨1.81% 银行板块领涨

hao333 8532次阅读2023-05-09 12:02
尴尬了!用ChatGPT写论文忘删生成按钮,出版商:撤稿

尴尬了!用ChatGPT写论文忘删生成按钮,出版商:撤稿

hao333 7417次阅读2023-09-11 14:33
2023年金融地产上市公司有哪些?金融地产上市公司一览

2023年金融地产上市公司有哪些?金融地产上市公司一览

hao333 7822次阅读2023-09-19 14:32
果浆概念股相关股票名单(9月18日)

果浆概念股相关股票名单(9月18日)

hao333 3404次阅读2023-09-18 13:40
专题页

HOT榜单

  • 高性价比紫米充电宝,支持22.5超级快充,到手价79元起

  • 东海美丽中国灵活配置混合增聘基金经理张浩硕

  • 花呗如何提前还款下个月的账单(花呗如何提前还款全部分期)

  • 证券板块涨1.17% 西南证券涨9.98%居首

  • 国元科技创新灵活配置年内涨8.39%

  • doi是什么意思(doi的具体解释是什么)

  • 腾讯云大模型新升级:保持节奏,一切为了“落地”

  • 碳中和板块涨0.1% 测绘股份涨7.77%居首

  • 贯穿22年发展历程,雅典FREAK ONE奇想腕表发布即经典

  • 房地产开发板块涨1.09% 万通发展涨9.98%居首

换一组看看

频道最IN
>鲁大师7月新机性能/流畅/久用榜:骁龙8 Gen2领先版亮相,性能跑分再破新高

鲁大师7月新机性能/流畅/久用榜:骁龙8 Gen2领先版亮相,性能跑分再破新高

>《宝可梦:朱紫》新7星太晶团体战活动预告:布里卡隆

《宝可梦:朱紫》新7星太晶团体战活动预告:布里卡隆

>火山引擎多云CDN获掘金技术引力榜:2023年度破局技术方案

火山引擎多云CDN获掘金技术引力榜:2023年度破局技术方案

关于我们 法律声明 联系我们 广告服务 隐私条款
@老男人网 版权所有/信息产业部备案号:蜀ICP备13015099号-1