关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家2490人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:湖人裁掉RJ-戴维斯、安东-沃特森等4人

懂球帝 浏览 2662

银行大动作!这类大额存单利率,跌破1%

中国基金报 浏览 2061

杨振宁留给中国的最重要遗产,恰恰很不“中国味”

钛媒体APP 浏览 2826

证监会“女老虎”获刑7年!丈夫空降华兴资本后被查,包凡也受牵连

财通社 浏览 648

被预制菜笼罩,商场餐饮大撤退?

餐饮老板内参 浏览 3060

郭爸曝郭碧婷家庭花销全靠她,嫁入"假豪门"?

代军哥哥谈娱乐 浏览 2850

397场,凯尔-沃克追平英超历史边后卫首发次数纪录

懂球帝 浏览 2506

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 2510

米兰冬奥中国体育代表团领奖装备亮相,藏着李宁的奥运“双胜”叙事

时代周报 浏览 2580

“躺赚”的企查查,是个苦生意?

定焦One 浏览 2894

陈奕迅回应患焦虑症:仍在服药看医生,但已好转大半

大象新闻 浏览 2873

星际之门计划捧红了这家公司,化废弃能源为AI算力,估值达百亿

DeepTech深科技 浏览 2710

闪电快讯|海信发布影游旗舰E8S,RGB-Mini LED价格下探

电厂 浏览 2000

2026年必追的四部谍战剧 陈道明、于和伟领衔主演

娱乐圈笔娱君 浏览 2077

银行长期限存款“退场”背后

北京商报 浏览 2546

慢镜头:莫塔不会回归尤文,但他的合同会影响尤文选帅

懂球帝 浏览 2503

美媒:美国曾以为贸易战能改变中国经济 但它错了

环球时报国际 浏览 10003

气场拉满:泰国改装厂让长城坦克300“变身”Brabus G63

IT之家 浏览 2011

今日热点:曾艳芬提醒丝芭传媒有聊天记录;边伯贤恶评者被罚款……

伊周潮流 浏览 2141

高市落泪称让民众不用担心中国 关键时刻金正恩出手了

时时有聊 浏览 6683

卡纳瓦罗:我会继续努力学习,看看以后是否有机会执教意大利

懂球帝 浏览 2156
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1