花花AI观察室 | 97.GPT-4o Mini被“吴恩达效应”攻破:AI也怕精神控制,竟和网络安全同样难以抵抗社会工程学
GPT-4o Mini 被“心理话术”骗了?服从率从1%飙到100%,只因为研究者用了人类经典的说服技巧——权威、承诺、同侪压力……你没看错,AI 也会“被绕进去”,还真不是bug,而是它太像我们了。
这背后暴露出一个令人惊悚的事实:当语言模型越像人,它就越容易被当人骗。AI的“人类弱点”,正是我们自己教给它的。
而破解这个困局的关键,也许不是更强的规则,而是一个被我们忽视的认知神器——“第三方视角”。
听这一期《花花AI观察室》,你会明白:
AI不是替代你思考的工具,而是帮你跳出语言陷阱的“冷静哨
立即观看