WormGPT“洗白”那一刻,黑帽AI真正的潘多拉盒子被打开了
正在加载视频...
视频章节
一个原本在黑客论坛兜售的“犯罪AI”,突然开始加护栏、谈白帽;几天后,一个更赤裸裸的 Evil-GPT 立刻补位。这个故事揭示了一个让整个 AI 行业都无法回避的现实:你封住的不是风险,只是把它转移给下一个人。
WormGPT“洗白”那一刻,黑帽AI真正的潘多拉盒子被打开了
一个原本在黑客论坛兜售的“犯罪AI”,突然开始加护栏、谈白帽;几天后,一个更赤裸裸的 Evil-GPT 立刻补位。这个故事揭示了一个让整个 AI 行业都无法回避的现实:你封住的不是风险,只是把它转移给下一个人。
真正的威胁,不是 AI 失控,而是“有人故意让它作恶”
几乎所有 AI 安全讨论,最后都会落在“对齐”和“误用”上:模型会不会不小心做坏事?回答错问题怎么办?但 The AI Daily Brief 一针见血地点出一个更刺耳的现实——如果有人从一开始就想让 AI 做坏事呢?
这不是假设。2023 年 8 月,《纽约邮报》直接点名:暗网里已经出现一批“犯罪专用聊天机器人”,它们像 ChatGPT 一样订阅制出售,却天生就为钓鱼、诈骗、恶意代码而生。DarkBERT、FraudGPT、WormGPT——名字毫不掩饰。
真正的变化不在于“犯罪出现了 AI”,而在于犯罪被规模化、平民化了。过去需要高技术门槛的攻击,现在只要会打字。正如安全专家所说:这是“可大规模个性化的犯罪”。不是群发垃圾邮件,而是为成千上万人量身定制诈骗话术。门槛的坍塌,才是最危险的事。
WormGPT 的反转:从“黑客神器”到被迫加护栏
WormGPT 一度是最臭名昭著的代表。它在黑客论坛的广告语几乎是挑衅式的——“你能想到的所有黑帽行为,都能用 WormGPT 完成。”价格 500 到 5000 欧元,买的不是模型,是绕开 ChatGPT 一切限制的自由。
安全公司 SlashNext 做过一次实验:用 WormGPT 生成一封 BEC(商业邮件欺诈)钓鱼邮件。结论只有一个词——“unsettling(令人不安)”。邮件不仅像真人写的,而且在心理策略上极其老练。
但剧情很快反转。WormGPT 的创建者,一位 23 岁的葡萄牙程序员 Rafael,在接受 Krebs on Security 采访时承认:他们正在加限制。禁止讨论谋杀、毒品、绑架、儿童色情、勒索软件、金融犯罪,甚至开始尝试封堵 BEC。
原因并不复杂:当你把工具卖给“做坏事的人”,他们真的会来做坏事。结果就是,WormGPT 正在慢慢变成一个“受控环境”。一个黑帽 AI,被现实逼着走向白帽。
创始人画像:他不是反派,更像是这个时代的缩影
Rafael 的经历,几乎就是一条灰帽到黑帽、再试图回头的标准路径。2013 年灰帽,2015 年学编程,2017 年混黑客论坛,2019 年彻底黑帽。经济压力、技术成就感、社区认同感,一步步把人推过去。
他说 WormGPT 不是为了钱,只是“一个有意思的项目”;他说模型强大的关键不在架构,而在于“数据集很大”;他说 WormGPT 和被 jailbreak 的 ChatGPT 没本质区别。
这段话真正刺耳的地方在于:他可能没说谎。
WormGPT 并不神秘,它不是外星科技,只是“限制被移除 + 数据集足够激进”的 LLM。这意味着一个残酷事实:只要基础模型存在,黑帽版本就永远有人能做出来。你封的只是“官方版本”。
WormGPT 变软的第二天,Evil-GPT 出现了
几乎是无缝衔接。WormGPT 被媒体曝光、开始“洗白”后,黑客论坛立刻出现新广告:Evil-GPT,自称“ChatGPT 的敌人”,10 美元,用 Python 写成,明确定位——替代 WormGPT。
这不是巧合,而是市场机制。黑帽 AI 不需要品牌忠诚度,只需要功能。一旦一个工具开始讲责任、谈边界,用户就会流向下一个更极端的选择。
这也是整个事件最值得警惕的信号:黑帽 AI 不会被消灭,只会不断分叉。 就像盗版软件、外挂、木马一样,封一个,出三个。
总结
这个故事对 AI 从业者的真正启示,并不是“要不要更严的对齐”,而是一个更现实的问题:你发布的能力,会被怎样的市场接住? 当最强大的通用模型开放给善意世界时,恶意世界会同步获得等价能力。
短期看,答案只能是更激进的安全研究、更真实的攻防演练,以及对模型发布节奏的重新评估。长期看,我们必须接受一个不舒服的前提:AI 安全不是“解决问题”,而是“管理后果”。
留给你的思考是:如果下一个更强模型发布时,黑帽版本只需要一周就能出现——你希望自己站在哪一边?
关键词: WormGPT, Evil-GPT, AI安全, 大语言模型, 黑帽AI
事实核查备注: 需要核查:1)《纽约邮报》文章发布时间为 2023-08-09;2)WormGPT 价格区间 500-5000 欧元;3)SlashNext 对 WormGPT 的 BEC 测试结论原文表述;4)Krebs on Security 对 Rafael 身份与背景的追踪细节;5)Evil-GPT 在黑客论坛的售价与宣传语。