微软工程师吹哨:DALL·E 3失控的那一刻,AI安全不再是口号
正在加载视频...
视频章节
一位在微软工作6年的AI工程师选择“掀桌子”:他公开指控自家AI绘图工具过于容易生成暴力、性化和未成年内容,并一路把问题捅到美国参议院和FTC。这不是一次普通的产品争议,而是生成式AI行业正在集体回避的安全拐点。
微软工程师吹哨:DALL·E 3失控的那一刻,AI安全不再是口号
一位在微软工作6年的AI工程师选择“掀桌子”:他公开指控自家AI绘图工具过于容易生成暴力、性化和未成年内容,并一路把问题捅到美国参议院和FTC。这不是一次普通的产品争议,而是生成式AI行业正在集体回避的安全拐点。
“这不是一个安全的模型”——微软内部红队先拉响警报
故事的起点并不戏剧化:Shane Jones,一名在微软工作了约6年的AI工程师,参与了Copilot Designer(微软的AI图像生成工具,基于DALL·E 3)的红队测试。红队的任务很明确——不是展示模型有多聪明,而是拼命找出它会“失控”的方式。
但Jones看到的结果,超出了他对“边缘案例”的心理预期。根据CNBC复现的测试,模型可以生成:与堕胎权相关的恶魔与怪物形象、手持突击步枪的青少年、带有暴力意味的性化女性形象,以及未成年人饮酒和吸毒的场景。Jones形容那一刻是“eye-opening moment”——不是模型偶尔出错,而是“这些内容根本不该向公众开放”。
更关键的是,这些并非历史版本的问题,而是在他测试前的三周内,媒体依然可以用同一工具复现。对一名参与安全测试的工程师来说,这意味着护栏不是被绕过,而是本身就不够高。
从内部汇报到国会山:一次吹哨为何会不断升级
Jones并非一开始就选择公开对抗。他在2023年12月开始内部汇报问题,微软也“承认了他的担忧”,但并未下架产品,而是将他指向OpenAI。当他迟迟未得到回应后,他在LinkedIn发布公开信,呼吁OpenAI董事会对DALL·E 3展开调查——随后被微软法务要求立即删除。
事情真正升级发生在2024年1月。Jones选择直接给美国参议员写信,并与参议院商务、科学和交通委员会的工作人员会面。本周,他又将信件寄给FTC主席Lina Khan以及微软董事会,并同步给了媒体。这已经不再是“产品建议”,而是标准的监管路径。
他的诉求其实很具体:要么在安全措施完善前下架Copilot Designer;要么至少增加风险披露,并把安卓端的应用评级改为“仅限成熟用户”。相比之下,微软的官方回应显得极为克制且模板化——强调内部流程、鼓励员工通过既有渠道反馈,却没有正面回应产品是否应该暂停的问题。
这也是整件事最刺眼的反差:一边是安全工程师认为“已经越线”,另一边是商业系统选择“继续上线观察”。
当安全踩刹车,行业却在集体加速
把视角拉远,这起事件并不是孤例,而是发生在一个“全面加速”的行业背景下。就在同一时间段,微软高调预告面向企业客户的“New Era of Work”活动,重点展示Surface新品和Windows 11的AI升级;Meta则披露,其正在打造一个统一的AI推荐模型,计划在2026年前支撑Facebook整个视频生态,仅一次模型架构调整,就带来了Reels 8%–10%的观看时长增长。
Salesforce也不甘落后,推出面向医生的Einstein Copilot Health,试图用自然语言AI自动化预约、病历摘要和转诊流程,直指医疗系统的行政负担。而在资本端,a16z计划募资69亿美元,其中相当比例直接押注AI基础设施和应用层。
这形成了一个微妙但真实的张力:安全问题正在“向上冒烟”,而商业、资本和产品节奏却没有任何放缓迹象。Jones的吹哨之所以重要,不只是因为他说了什么,而是因为他说话的时间点——当几乎所有激励机制,都在推动AI更快上线、更多分发的时候。
总结
这件事对AI从业者真正的启示,并不是“微软做错了什么”,而是一个更残酷的现实:在大厂体系内,安全往往只有在触发监管和舆论之前,才会被认真对待。作为开发者、产品经理或创业者,你需要更早问自己三个问题:这个模型最坏能生成什么?这些内容一旦被滥用,责任会落在谁身上?当上线压力和安全判断冲突时,你有没有为后者留出制度空间?
接下来值得关注的,不只是Jones的信会不会引发调查,而是监管机构是否会开始把“生成结果本身”而非“使用方式”纳入问责范围。如果那一天到来,今天看似保守的安全决策,可能会成为你最便宜的一次选择。
关键词: 微软, DALL-E 3, AI安全, 生成式AI, AI伦理
事实核查备注: 需要核查的关键事实包括:Shane Jones在微软的任职时间(约6年);Copilot Designer基于DALL·E 3;CNBC对图像生成内容的复现时间(2024年3月);Jones写信给的机构(美国参议院、FTC主席Lina Khan、微软董事会);Meta提到的Reels观看时长提升比例(8%–10%);a16z募资金额(69亿美元)