离开 DeepMind 后，他为什么押注开源大模型这条“更难的路”

AI PM 编辑部 · 2023年10月06日 · 3 阅读 · AI/人工智能

Embedding 多模态微调开源模型闭源模型大语言模型 AI安全深度学习生成式AI 通用人工智能

正在加载视频...

视频章节

当所有人都在追逐更大、更封闭的模型时，Mistral 联合创始人 Arthur Mensch 却反其道而行，公开模型权重、押注开源，并直言：只有拿到权重，才真正谈得上安全与可控。这场与 Stripe 创始人 John Collison 的炉边谈话，透露了欧洲 AI 的另一种未来。

离开 DeepMind 后，他为什么押注开源大模型这条“更难的路”

当所有人都在追逐更大、更封闭的模型时，Mistral 联合创始人 Arthur Mensch 却反其道而行，公开模型权重、押注开源，并直言：只有拿到权重，才真正谈得上安全与可控。这场与 Stripe 创始人 John Collison 的炉边谈话，透露了欧洲 AI 的另一种未来。

一个反直觉的判断：模型越开源，反而越安全

在这场对话里，Arthur Mensch 抛出了一个足以引发争议的观点：AI 安全的前提不是“封闭”，而是“可控”，而可控来自开源。在主流叙事中，GPT-4、Claude 这类闭源模型往往被视为“更安全”，因为它们不暴露权重。但 Arthur 的逻辑恰恰相反——如果你拿不到模型权重，你就无法真正理解模型在做什么，也无法把自己的审核标准、合规逻辑“编码进模型”。

他强调，只有当模型权重在你手中，你才能调整、微调、约束模型行为，甚至针对特定场景做内容安全设计。这也是 Mistral 坚持发布权重的根本原因之一。在他看来，安全不是一个外包给模型厂商的承诺，而是一种工程能力，而工程能力必须建立在可见、可控之上。

从 Chinchilla 到 Mistral：技术路线的分岔口

Arthur 并不是“理想主义式”地谈开源。他在 DeepMind 主导的 Chinchilla 论文，本身就是一篇改变行业训练范式的基础研究。也正因为如此，他对“规模”“算力”“成本效益曲线”异常敏感。

在 Mistral，他明确表示不会盲目追逐超大模型，而是从小模型起步，严格遵守成本效益曲线。这背后有一个现实判断：当模型真正进入企业生产环境，客户关心的第一顺位不是参数规模，而是成本、可控性和可定制性。

这也解释了为什么 Mistral 同时做两件事：一边构建“最好的开源模型家族”，一边也提供托管和专有方案。但它的“根”始终在开源上——成为一家“以开源为基础的核心大语言模型提供商”。

为什么 Llama 2 是机会，而不是威胁

当被问到 Meta 发布 Llama 2 时，Arthur 的反应并不是防御，而是欢迎。他认为，大模型一旦开放，真正的价值才开始释放：你可以重新训练、重复利用计算资源、根据自己的数据进行优化。

这正是开源社区的力量所在——不是“拿来即用”，而是“拿来改造”。Mistral 计划发布的一系列模型，也正是希望被社区使用、改进、再反馈。这种路径与闭源模型形成了鲜明对比：前者是生态，后者更像产品。

Arthur 甚至直言，Meta 与 Mistral 在理念上是一致的：开放并不削弱竞争力，反而放大了技术的长期价值。

幻觉、RAG、Embedding：问题不是一个模型能不能解决

关于大模型“幻觉”这一老大难问题，Arthur 给出的答案并不花哨，但非常工程化。他认为解决路径来自三方面的组合：长期训练中的知识注入、检索增强生成（RAG），以及通过微调让模型更严格地遵循上下文。

更重要的是，他强调生成模型必须与语义向量模型（Embedding）协同工作。这意味着，未来的 AI 系统不是一个“万能模型”，而是一整套模块化架构。而在这一过程中，开源再次成为优势：你可以替换组件、调整流程，而不是被一个黑箱模型的输出所支配。

欧洲 AI 的机会，不在复制硅谷

谈到法国乃至欧洲的 AI 复兴，Arthur 给出了一个清晰判断：这并不是偶然，而是教育体系与技术生态长期共振的结果。法国对数学和计算机科学的重视，为大模型时代提供了关键土壤。

但他也提醒，欧洲真正的机会不在于“复制美国模式”。数据隐私、监管环境、企业需求都不同，这也是 Mistral 从一开始就选择开源的重要原因。在他看来，好的监管应该提升可审计性，而不是设置硬性门槛——否则只会抑制创新。

至于 AGI？Arthur 选择避开这个语义陷阱。他更关心的是一件务实的事：把生成式 AI 做成真正可用、可控、为企业赋能的工具。

总结

这场对话释放的信号非常清晰：大模型的未来，并不只属于更大、更封闭的系统。开源不只是理想，更是一种成本、控制力和长期竞争力的综合选择。对从业者来说，这意味着两点行动建议：第一，别只学“怎么用 API”，而要真正理解模型、训练小模型，建立技术直觉；第二，关注开源生态的演进，它很可能决定下一波 AI 基础设施的走向。一个值得思考的问题是：当企业真正大规模部署 AI 时，你手里的模型，是黑箱，还是工具？

关键词： Mistral AI，开源大模型， Arthur Mensch， AI安全，欧洲AI

事实核查备注： Arthur Mensch 曾在 Google DeepMind 任研究员并参与 Chinchilla 论文；Mistral AI 的开源模型战略及发布权重的表述；Meta 发布 Llama 2 的时间与性质；对话发生于 Stripe AI Day Paris，发布时间 2023-10-06。

返回文章列表