WormGPT“洗白”那一刻，黑帽AI真正的潘多拉盒子被打开了

AI PM 编辑部 · 2023年08月13日 · 4 阅读 · AI/人工智能

AI对齐大语言模型 AI安全生成式AI 对话AI ChatGPT Bard Google

正在加载视频...

视频章节

一个原本在黑客论坛兜售的“犯罪AI”，突然开始加护栏、谈白帽；几天后，一个更赤裸裸的 Evil-GPT 立刻补位。这个故事揭示了一个让整个 AI 行业都无法回避的现实：你封住的不是风险，只是把它转移给下一个人。

WormGPT“洗白”那一刻，黑帽AI真正的潘多拉盒子被打开了

一个原本在黑客论坛兜售的“犯罪AI”，突然开始加护栏、谈白帽；几天后，一个更赤裸裸的 Evil-GPT 立刻补位。这个故事揭示了一个让整个 AI 行业都无法回避的现实：你封住的不是风险，只是把它转移给下一个人。

真正的威胁，不是 AI 失控，而是“有人故意让它作恶”

几乎所有 AI 安全讨论，最后都会落在“对齐”和“误用”上：模型会不会不小心做坏事？回答错问题怎么办？但 The AI Daily Brief 一针见血地点出一个更刺耳的现实——如果有人从一开始就想让 AI 做坏事呢？

这不是假设。2023 年 8 月，《纽约邮报》直接点名：暗网里已经出现一批“犯罪专用聊天机器人”，它们像 ChatGPT 一样订阅制出售，却天生就为钓鱼、诈骗、恶意代码而生。DarkBERT、FraudGPT、WormGPT——名字毫不掩饰。

真正的变化不在于“犯罪出现了 AI”，而在于犯罪被规模化、平民化了。过去需要高技术门槛的攻击，现在只要会打字。正如安全专家所说：这是“可大规模个性化的犯罪”。不是群发垃圾邮件，而是为成千上万人量身定制诈骗话术。门槛的坍塌，才是最危险的事。

WormGPT 的反转：从“黑客神器”到被迫加护栏

WormGPT 一度是最臭名昭著的代表。它在黑客论坛的广告语几乎是挑衅式的——“你能想到的所有黑帽行为，都能用 WormGPT 完成。”价格 500 到 5000 欧元，买的不是模型，是绕开 ChatGPT 一切限制的自由。

安全公司 SlashNext 做过一次实验：用 WormGPT 生成一封 BEC（商业邮件欺诈）钓鱼邮件。结论只有一个词——“unsettling（令人不安）”。邮件不仅像真人写的，而且在心理策略上极其老练。

但剧情很快反转。WormGPT 的创建者，一位 23 岁的葡萄牙程序员 Rafael，在接受 Krebs on Security 采访时承认：他们正在加限制。禁止讨论谋杀、毒品、绑架、儿童色情、勒索软件、金融犯罪，甚至开始尝试封堵 BEC。

原因并不复杂：当你把工具卖给“做坏事的人”，他们真的会来做坏事。结果就是，WormGPT 正在慢慢变成一个“受控环境”。一个黑帽 AI，被现实逼着走向白帽。

创始人画像：他不是反派，更像是这个时代的缩影

Rafael 的经历，几乎就是一条灰帽到黑帽、再试图回头的标准路径。2013 年灰帽，2015 年学编程，2017 年混黑客论坛，2019 年彻底黑帽。经济压力、技术成就感、社区认同感，一步步把人推过去。

他说 WormGPT 不是为了钱，只是“一个有意思的项目”；他说模型强大的关键不在架构，而在于“数据集很大”；他说 WormGPT 和被 jailbreak 的 ChatGPT 没本质区别。

这段话真正刺耳的地方在于：他可能没说谎。

WormGPT 并不神秘，它不是外星科技，只是“限制被移除 + 数据集足够激进”的 LLM。这意味着一个残酷事实：只要基础模型存在，黑帽版本就永远有人能做出来。你封的只是“官方版本”。

WormGPT 变软的第二天，Evil-GPT 出现了

几乎是无缝衔接。WormGPT 被媒体曝光、开始“洗白”后，黑客论坛立刻出现新广告：Evil-GPT，自称“ChatGPT 的敌人”，10 美元，用 Python 写成，明确定位——替代 WormGPT。

这不是巧合，而是市场机制。黑帽 AI 不需要品牌忠诚度，只需要功能。一旦一个工具开始讲责任、谈边界，用户就会流向下一个更极端的选择。

这也是整个事件最值得警惕的信号：黑帽 AI 不会被消灭，只会不断分叉。 就像盗版软件、外挂、木马一样，封一个，出三个。

总结

这个故事对 AI 从业者的真正启示，并不是“要不要更严的对齐”，而是一个更现实的问题：你发布的能力，会被怎样的市场接住？ 当最强大的通用模型开放给善意世界时，恶意世界会同步获得等价能力。

短期看，答案只能是更激进的安全研究、更真实的攻防演练，以及对模型发布节奏的重新评估。长期看，我们必须接受一个不舒服的前提：AI 安全不是“解决问题”，而是“管理后果”。

留给你的思考是：如果下一个更强模型发布时，黑帽版本只需要一周就能出现——你希望自己站在哪一边？

关键词： WormGPT， Evil-GPT， AI安全，大语言模型，黑帽AI

事实核查备注：需要核查：1）《纽约邮报》文章发布时间为 2023-08-09；2）WormGPT 价格区间 500-5000 欧元；3）SlashNext 对 WormGPT 的 BEC 测试结论原文表述；4）Krebs on Security 对 Rafael 身份与背景的追踪细节；5）Evil-GPT 在黑客论坛的售价与宣传语。

返回文章列表