38TB数据泄露、AI大佬同桌失焦、软银再押注：这一周的AI太真实了

AI PM 编辑部 · 2023年09月19日 · 3 阅读 · AI/人工智能

Elon Musk Greg Brockman Sam Altman AI芯片 AI应用微调大语言模型 AI安全生成式AI 检索增强生成

正在加载视频...

视频章节

如果你还觉得AI时代最难的是模型效果，这条新闻会让你清醒：微软AI研究员一个配置失误，38TB敏感数据直接“裸奔”在GitHub。更魔幻的是，同一周里，AI安全圆桌聊成了政治交锋，而软银正准备把几十亿美元继续砸向AI。这不是科幻，是正在发生的行业现实。

38TB数据泄露、AI大佬同桌失焦、软银再押注：这一周的AI太真实了

如果你还觉得AI时代最难的是模型效果，这条新闻会让你清醒：微软AI研究员一个配置失误，38TB敏感数据直接“裸奔”在GitHub。更魔幻的是，同一周里，AI安全圆桌聊成了政治交锋，而软银正准备把几十亿美元继续砸向AI。这不是科幻，是正在发生的行业现实。

38TB不是技术问题，而是所有AI团队都会踩的坑

先说这起足以写进教科书的事故：微软AI研究人员在GitHub上分享开源代码和计算机视觉模型时，一个Azure存储URL配置错误，把“只读权限”变成了“整个存储账户的完全控制权”。结果是什么？38TB内部数据被暴露，包括密码、私钥、员工个人电脑备份，甚至还有超过3万条微软Teams内部聊天记录。

最刺眼的不是规模，而是性质——这不是黑客攻击，而是一次“好心分享代码”的副作用。Whiz发现问题后在6月22日就通知了微软，两天内问题被修复，但数据暴露最早可以追溯到2020年。

微软的复盘里有一句话值得反复看：“没有客户数据被暴露。”这句话在公关上是加分项，但对AI从业者来说，更重要的是另一层含义：在AI研发中，代码、模型、数据、云存储已经高度耦合，一个最小权限原则的疏忽，就可能让整个组织的数字资产失控。

这也是为什么微软随后扩展了GitHub Secret Scanning服务——不是因为AI更危险了，而是因为AI团队分享得更频繁、链路更复杂了。正如Whiz那句评价：“AI的潜力是无限的，但数据安全必须是第一优先级。”

当AI安全圆桌，变成了另一种战场

同一集节目里，还有一幕耐人寻味的画面：以“AI圆桌”为名的对话，参与者包括以色列总理、OpenAI联合创始人Greg Brockman、AI安全学者Max Tegmark，以及X的老板Elon Musk。

但结果呢？几乎没有媒体去复述他们在AI上说了什么。讨论迅速偏离技术，转向反犹主义、内容审查，以及Elon Musk与反诽谤联盟之间的冲突。

这本身就是一个强烈信号：当AI进入权力、舆论和地缘政治的中心，技术议题很容易被更高优先级的社会议题“吞没”。对从业者来说，这意味着AI安全不再只是模型对齐或系统鲁棒性的问题，而是会被直接拉进公共价值观和政治冲突中。

你可能做的是一个看似中立的模型，但你所处的语境，已经不再中立。

软银、OpenAI和“也许正在形成的泡沫”

如果说安全和舆论是压力面，那资本的另一面依然火热。ARM IPO后，软银显然重新找回了进攻欲望。《金融时报》披露，软银正在考虑投资ChatGPT背后的OpenAI，甚至不排除更深层的战略合作。

有意思的是，同一批消息源也提到：软银同时在接触OpenAI的竞争对手，还探索过收购英国AI芯片公司Graphcore。孙正义一边高调表示自己是ChatGPT的重度用户，一边几乎每天与Sam Altman通话；另一边，他又在为“下一个AI基础设施”做多手准备。

这正是当前AI投资的真实状态：信仰与对冲并存。有人说，如果现在还不是AI泡沫，那在软银的助推下，可能很快就会是。至少可以确定的是，资金已经不满足于“模型本身”，而是在寻找芯片、平台和企业级落地的确定性。

企业级AI真正的护城河，不在模型里

这一点在Writer的1亿美元B轮融资中体现得很清楚。Writer并没有强调自己有多大的模型，而是反复强调：真正的工作在LLM之后——知识图谱、RAG、数据清洗、工作流、安全护栏。

他们的CEO一句话点破现实：“企业级生成式AI，90%的工作不在模型本身。”这和摩根士丹利推出的AI助理形成了呼应：基于OpenAI技术，但真正的价值来自10万多份内部研究文档，以及围绕金融顾问场景的深度定制。

还有一个容易被忽视的细节：Writer特意强调其模型训练数据不涉及版权内容。在版权边界仍然模糊的当下，这已经成为企业级AI的隐形门槛，而不仅是法律声明。

总结

把这几条新闻放在一起看，会得到一个清晰但不那么乐观的结论：AI行业正在从“模型竞赛”，进入“系统责任”的阶段。数据安全的一个小失误，就可能带来灾难性后果；AI安全讨论正在被更大的社会议题裹挟；而资本依旧汹涌，但更偏爱能落地、能合规、能控风险的团队。

对AI从业者来说，真正的行动建议只有三点：第一，重新审视你们的数据与权限配置，它们可能比模型参数更重要；第二，理解你所做的AI会进入怎样的社会语境；第三，把时间多花在“模型之后”的那90%工作上。下一个竞争优势，很可能就藏在那里。

关键词： AI安全，微软，数据泄露， OpenAI，企业级AI

事实核查备注：需要核查的关键事实包括：微软AI研究人员泄露的数据规模为38TB；Whiz发现并于2023-06-22通知微软；数据最早可追溯至2020年；泄露内容包含密码、私钥、PC备份和约3万条Teams消息；软银考虑投资OpenAI及接触Graphcore的报道来源为《金融时报》；Writer完成1亿美元B轮融资；摩根士丹利AI助理基于OpenAI并使用10万+内部文档。

返回文章列表