GPT-4意外战胜阴谋论：一次对话，把铁杆信徒拉回现实

AI PM 编辑部 · 2024年04月05日 · 5 阅读 · AI/人工智能

AI应用大语言模型 AI安全生成式AI AI伦理对话AI ChatGPT GPT-4

正在加载视频...

视频章节

一个反直觉的结果正在震动AI圈：不是心理安慰，也不是情绪共鸣，而是三轮与GPT-4的理性对话，竟然能让最顽固的阴谋论者显著动摇信念，而且效果持续数月。这不仅关乎辟谣，更关乎AI的说服力边界。

GPT-4意外战胜阴谋论：一次对话，把铁杆信徒拉回现实

一个反直觉的结果正在震动AI圈：不是心理安慰，也不是情绪共鸣，而是三轮与GPT-4的理性对话，竟然能让最顽固的阴谋论者显著动摇信念，而且效果持续数月。这不仅关乎辟谣，更关乎AI的说服力边界。

最反直觉的发现：阴谋论，真的能被“讲道理”说服

长期以来，一个几乎被写进社会心理学“潜规则”的判断是：阴谋论信念极其顽固，越反驳，越加深。MIT 和康奈尔的一项随机对照实验却给出了完全相反的结果——只用三轮、十来分钟的 GPT-4 对话，就能让阴谋论信念平均下降约20个百分点。

更震撼的是对象：不是摇摆者，而是自我认同强烈、把阴谋论视为身份一部分的“真信徒”。研究负责人之一 David Rand 直接点破行业误判：“阴谋论并非天生免疫证据，只是我们过去几乎从未提供过真正针对性的反证。”

这句话对AI从业者格外刺耳。问题可能从来不在“人不理性”，而在于反驳成本太高——人类很难为每一种阴谋论的每个变体，逐条准备证据。但对大模型来说，这恰恰是强项。

三轮对话的魔力：GPT-4到底做对了什么

实验设计并不复杂，却极其“AI原生”。2190名参与者先完整描述自己相信的阴谋论，以及支撑它的证据，并给出0到100的确信度。随后，他们与 GPT-4 进行三轮实时文字对话，模型被明确要求“反驳该阴谋论”。

关键在“反驳方式”。以 9·11 阴谋论为例，GPT-4 的第一反应不是否定，而是承认疑问的合理性：“在如此复杂和震撼的事件中产生疑问是可以理解的。”随后才逐条回应——世贸7号楼为何倒塌、钢结构是否真的需要融化、布什在教室里的反应意味着什么。

语气不居高临下，逻辑却异常具体。每一次回应，都是紧贴对方刚刚提出的论点，而不是预制的“辟谣话术”。结果是惊人的：那位最初给出100%确信度的参与者，在三轮结束后，把自己的评分改成了40%。不是被说服“全错了”，而是开始怀疑“也许没那么确定”。这恰恰是信念松动的关键时刻。

不靠共情、不打鸡汤：真正起作用的是“硬核理性”

研究团队事后做了一个非常AI从业者视角的分析：GPT-4到底在用哪种说服策略？他们把模型的回应拆成四类——心理诉求、修辞叙事、建立关系、以及理性推理。

结果可能会让很多“对话设计专家”感到意外：最少使用的，恰恰是心理和修辞手段；真正占比最高的，是“替代性解释、批判性思维、冲突证据和逻辑不一致”。换句话说，GPT-4 并没有试图满足身份认同或情绪需求，而是持续、耐心地给出更好的解释。

更值得警惕的是外溢效应。研究发现，这种针对单一阴谋论的对话，会顺带降低参与者对其他、完全不相关阴谋论的信任度，甚至改变行为意图——比如更愿意在社交媒体上反驳阴谋论，或取消关注相关账号。这意味着，大模型不是只在“赢一场辩论”，而是在重塑一个人的认知习惯。

双刃剑已出鞘：当AI的说服力超过人类

故事并没有一个轻松的结尾。正如 Ethan Mollick 提醒的那样：如果 GPT-4 能更有效地“去阴谋化”，它同样可能被用来制造和强化阴谋论。另一项随机对照研究已经表明，GPT-4 在辩论中改变他人观点的能力，平均水平超过人类对手。

David Rand 的表态相当克制：“没有护栏的 LLM，同样可能被用来让人相信虚假和有害的东西。”这项研究一方面证明了“证据和论证依然有用”，另一方面也赤裸裸地展示了生成式AI的 persuasion power 已经不再是理论问题，而是现实能力。

当大模型逐渐渗透进搜索、社交、客服和教育系统，谁来定义它该用多大的力气去‘说服’用户，将成为比模型参数更棘手的议题。

总结

这项研究给AI从业者留下了三个清晰的启示：第一，别再低估理性证据的力量，真正的问题往往是“是否足够具体、是否足够耐心”；第二，大模型的核心优势不是情商，而是几乎无限的定制化论证能力；第三，说服力已经成为一种需要被设计、被约束的能力，而不是附带效果。

如果你在做AI产品，现在就该问自己一个问题：当模型能够稳定改变用户信念时，你是否清楚它“应该”改变到哪一步？这可能会是未来几年，AI伦理中最难、也最现实的一道考题。

关键词： GPT-4，阴谋论， AI说服力，对话AI， AI伦理

事实核查备注：需要核查的事实包括：研究作者 David Rand、Tom Costello、Gordon Pennycook 的隶属机构；实验样本量2190人及“20个百分点”下降幅度；效果持续时间“两个月以上”；Ethan Mollick 提及的另一项随机对照研究的具体结论；视频发布时间 2024-04-05。

返回文章列表