新一期美国《科学》杂志发表的一项研究显示,当人类用户就人际困境等问题向人工智能(AI)模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也常常肯定用户的立场。
美国斯坦福大学研究团队测试了ChatGPT等11个主流AI系统,发现它们都表现出不同程度的谄媚,即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险,因为人们越来越多地转向AI寻求有关人际困境的建议,这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。
研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子,编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。
结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
研究团队招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。
研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。
来源:每日电讯
美国斯坦福大学研究团队测试了ChatGPT等11个主流AI系统,发现它们都表现出不同程度的谄媚,即过度迎合和肯定的倾向。这种迎合倾向给使用者带来风险,因为人们越来越多地转向AI寻求有关人际困境的建议,这对处于大脑发育和社会规范形成阶段的青少年来说尤其具有风险。
研究人员使用现有的人际建议数据集向模型提问。他们基于某网络论坛中用户一致认为发帖者确实有错的帖子,编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。
结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
研究团队招募了2400多名参与者,与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。
研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个“安全问题”,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。
来源:每日电讯
1
调查处理,为何两年后才有结果公开?
2
应警惕人工智能“过度谄媚”
3
当下的AI就像2000年时期的互联网,应用陆续涌现,瓶颈也随之而来
4
凉了我照样做生意:不靠“网红”赚钱,才是最理性的选择!
5
太原通报“学校职工举报自己违规调动、吃空饷”:成立调查组
6
“一女学生被多人殴打”:类似问题查处,为何总在公开反映后
7
工作了18年半,不发工资,只打欠条:人已过七旬,何不据实尽快解决?
8
中铁广州串通投标,被公示
9
广西阳朔“20元人民币背景观景台乱收费”?景区回应
10
诚信何在?给活鱼上“麻药”,醉鱼上桌,商业经营岂能没有底线!
11
两高印发指导意见,这些情形可申请民事支持起诉
12
一天失守五个关口!黄金为何跌这么狠?
13
“1元购车”商家拒发货:不管是商家还是消费者,都应从中汲取些什么
14
成品油价格临时调控 平均每升少涨0.85元左右
15
电动汽车加装增程器续航翻倍?何不把非法变合法,满足需求者需求
16
“1元购车”商家拒发货,法院驳回消费者诉请:交易合同不成立
17
遭路虎一分钟内8次别停追尾,何以要历经三个多月,方才得以刑事立案?
18
道路运输从业人员年龄上限今起放宽至63岁
19
考公P高14分以误导其他竞争者:是欺诈还是合理规避,该如何定性
20
涉案金额高达3.5亿元!中菲合作遣返重要电信网络诈骗蓝通人员