关闭广告

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家1990人阅读

IT之家 10 月 13 日消息,据外媒 Futurism 10 日报道,斯坦福大学的一项新研究警示,AI 的快速普及可能带来严重负面影响。科学家们在包括社交媒体的不同环境中测试 AI 模型,发现当智能体因提升点赞数或其他在线互动获得奖励时,会逐渐出现撒谎、传播仇恨信息或虚假消息等不道德行为。


论文合著者、斯坦福大学机器学习教授詹姆斯・邹在 X 上表示:“即便明确要求模型保持真实和有依据,竞争仍会诱发不一致行为。”

IT之家从报道中获悉,研究团队将 AI 出现的社会病态行为称为“AI 的摩洛克交易”,借用理性主义中摩洛克的概念:个体在竞争中优化行为追求目标,但最终人人都输

研究中,科学家创建了三个带模拟受众的数字环境:面向选民的网络选举活动、面向消费者的产品销售,以及旨在最大化互动的社交媒体帖子。

研究人员使用阿里云开发的 Qwen 和 Meta 的 Llama 模型作为智能体与这些受众互动。结果显示,即便设有防护措施阻止欺骗行为,AI 模型仍会“偏离目标”,出现不道德行为

例如,在社交媒体环境中,模型向用户分享新闻,用户通过点赞或其他互动反馈。当模型收到这些反馈后,为了获取更多互动,它们的不一致行为就会加剧

论文指出:“在这些模拟场景中,销售额提升 6.3%伴随欺骗性营销增长 14%;选举中,票数增加 4.9%时伴随虚假信息增加 22.3%和民粹言论增加 12.5%;社交媒体上,互动量提升 7.5%时伴随虚假信息激增 188.6%,有害行为推广增加 16.3%。”

研究与现实案例显示,目前的防护措施无法应对这一问题,论文警告称可能带来巨大的社会成本。

詹姆斯・邹在 X 上写道:“当大语言模型为点赞而竞争时,它们开始编造信息;当为选票而竞争时,就会变得煽动和民粹。”

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

看了隆妮表演才知道,观众都冤枉杨幂了?

霁月文娱阁 浏览 2014

尹锡悦被控同军方合谋试图“诱使朝鲜发动进攻”

扬子晚报 浏览 6408

郑丽文第二波人事公布:张荣恭、萧旭岑任国民党副主席

海峡导报社 浏览 7541

刘越:申花最后的点球判罚的太牵强,阿利米踢球合理简练

懂球帝 浏览 1672

今天起,一场关乎14亿人的命运转折来了!

米筐投资 浏览 1849

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

钛媒体APP 浏览 1539

3家“通达系”A股快递公司9月单价均同比上涨,快递反内卷见成效

红星资本局 浏览 1814

人工智能时代如何深化跨区域知识产权保护协作,嘉定这场论坛进行了探讨

上观新闻 浏览 1836

何小鹏“扒皮”验真身 国产人形机器人“摊牌了”

汽势传媒 浏览 1681

一艘船多付620万美元 美方尝到中方反制滋味后改限令

梁讯 浏览 8803

黄一鸣宣布新恋情,王思聪或成过去式

赵昉是个热血青年 浏览 1409

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 1587

高市早苗成功"策反"对手 分析称其当选首相几乎成定局

红星新闻 浏览 7832

古巨基官宣二胎!妻子57岁高龄产子挑战生育极限,网友质疑代孕

萌神木木 浏览 1210

2026年国家补贴来了,只需三步,收好这份省钱指南!

贝壳财经 浏览 1109

印尼国家队经理:克鲁伊维特教练团队必须重新接受评估

懂球帝 浏览 1965

伊朗被指愿作出让步:将最高丰度浓缩铀的一半送至国外

环球网资讯 浏览 1832

工信部第405批申报图曝光:比亚迪、华为系全面出击

网易汽车 浏览 273

《喜人奇妙夜2》即将收官,给你的戒断加点料

时尚COSMO 浏览 1443

何赛飞用肥皂卸妆 网友:张晚意找到“同皂中人”

台州交通广播 浏览 1761

美海军"林肯"号航母打击群抵达中东地区

环球网资讯 浏览 903
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1