Stability AI 丢出 FreeWilly：开源模型开始正面追平 ChatGPT 的一天

AI PM 编辑部 · 2023年07月24日 · 3 阅读 · AI/人工智能

Elon Musk AI应用微调开源模型大语言模型 AI安全生成式AI 模型训练 Stable Diffusion ChatGPT

正在加载视频...

视频章节

如果你还觉得“开源大模型=玩具”，那这条新闻可能会让你改观。Stability AI 推出的 FreeWilly 2，在多项标准化测试中直接对标 GPT‑3.5；与此同时，Llama 2 被集体质疑“根本不算开源”，AI 安全、治理与权力边界的问题也被同时点燃。

Stability AI 丢出 FreeWilly：开源模型开始正面追平 ChatGPT 的一天

如果你还觉得“开源大模型=玩具”，那这条新闻可能会让你改观。Stability AI 推出的 FreeWilly 2，在多项标准化测试中直接对标 GPT‑3.5；与此同时，Llama 2 被集体质疑“根本不算开源”，AI 安全、治理与权力边界的问题也被同时点燃。

FreeWilly 出现的真正震撼点，不是参数，而是方法

Stability AI 这次扔出的 FreeWilly，并不是“又一个 LLaMA 微调模型”这么简单。真正让业内警觉的是：FreeWilly 2 在 LSAT 逻辑推理、分析推理、SAT 英语等任务上，已经能和 GPT‑3.5 正面掰手腕。

关键不在 65B 还是 70B，而在训练路径。FreeWilly 的思路直接借鉴了微软 Orca 的方法——用 GPT‑4 生成“复杂解释轨迹”，再用这些高质量、结构化的合成数据去教小模型推理。这意味着什么？意味着 Scaling Laws 不再是唯一道路，“会解释的老师 + 更聪明的学习方式”正在成为新的杠杆。

Stability AI 自己说得很直白：这是一次训练方法实验，而不是商业产品。模型目前是非商业许可，但 CEO Ahmad 也暗示，未来商业化可能会走类似 Llama 2 的路线。这句话背后的潜台词是：一旦方法跑通，真正的竞争才刚刚开始。

Llama 2 被围攻：为什么“开源”这个词突然变得这么敏感

几乎在同一时间，Meta 因为 Llama 2 被 Open Source Initiative 点名批评：你这不叫开源。

OSI 的核心观点很简单，但杀伤力极强：开源不是“你能下载”，而是“你能自由使用”。只要在许可证里限制商业用途、限制使用领域、限制训练其他模型，就已经越界了。

更有意思的是反方观点。Latent Space 主持人 Alessio Fanelli 直接说：是的，Llama 2 不符合传统开源定义，但这其实没那么重要。原因在于，大模型不是代码仓库，而是模型权重、数据、训练流程、安全对齐的混合体，“开源/不开源”这套二分法，正在失效。

这场争论真正的价值，不是给 Meta 定性，而是逼整个行业承认一件事：我们正在发明一种全新的‘开放程度刻度’，而不是复用 Linux 时代的词汇。

安全不再只是口号：从 OpenAI 人事变动到白宫承诺

当模型能力逼近 GPT‑4，安全就不再是 PPT 里的章节。

OpenAI 信任与安全负责人 Dave Willner 离职，虽然官方原因是“陪伴家庭”，但舆论反应之大，本身就说明 AI 安全已经是高压区。几乎同时，白宫拉着 OpenAI、Meta、Google、Microsoft 等七家公司，签下了一套“自愿性 AI 安全承诺”。

OpenAI 的表态尤其耐人寻味：这些承诺，只适用于“比 GPT‑4 更强的未来模型”。换句话说，现在我们用的模型，已经被默认放在‘历史安全基线’里了。

Inflection AI 的说法则更直白——安全不能再停留在会议和论文里，尤其是在选举这样的高风险场景。他们甚至明确呼吁：立法禁止 AI 参与选举宣传。这种姿态，既是价值宣言，也是提前站位。

当一切都“Powered by AI”，X 会成为下一个试验场吗？

在一堆严肃话题的最后，马斯克还是成功抢走了注意力。

Twitter 改名 X，不只是品牌重塑，而是野心宣言。Linda Yaccarino 那句“Powered by AI”，在 AI 圈被无限放大。为什么？因为如果 X 真要变成集内容、支付、社交、市场于一体的平台，那 AI 将不再只是功能，而是调度整个系统的中枢。

推荐、审核、创作、交易、客服——一旦全部由模型驱动，X 很可能成为‘大模型社会化应用’的第一个真实压力测试场。问题不是它会不会成功，而是：我们是否准备好接受这种规模的 AI 介入。

总结

把这些新闻连在一起看，会出现一个清晰信号：大模型竞争，正在从“谁更大”转向“谁更聪明、谁更敢放、谁更能兜底”。FreeWilly 证明方法论正在撬动能力边界；Llama 2 争议说明语言和规则本身就是权力；而安全与治理，则开始从道德讨论走向现实博弈。

对从业者来说，真正的行动建议只有一个：别只盯着参数表。去研究训练方法、许可证细节和安全约束，因为下一代竞争优势，很可能不在模型里，而在模型之外。未来 12 个月，我们会看到更多“看起来不像突破，却改变格局”的时刻。

关键词： FreeWilly，开源大模型， Llama 2 争议， AI 安全治理， Stability AI

事实核查备注：需要核查：1）FreeWilly 1/2 所基于的 LLaMA 模型参数规模；2）Stability AI 对比 GPT‑3.5 的具体测试项目；3）OSI 对 Llama 2 的原文声明措辞；4）OpenAI 白宫承诺中对模型能力范围的定义；5）Inflection AI 关于选举与 AI 的具体表述时间与原文。

返回文章列表