离开 DeepMind 后,他为什么押注开源大模型这条“更难的路”
正在加载视频...
视频章节
当所有人都在追逐更大、更封闭的模型时,Mistral 联合创始人 Arthur Mensch 却反其道而行,公开模型权重、押注开源,并直言:只有拿到权重,才真正谈得上安全与可控。这场与 Stripe 创始人 John Collison 的炉边谈话,透露了欧洲 AI 的另一种未来。
离开 DeepMind 后,他为什么押注开源大模型这条“更难的路”
当所有人都在追逐更大、更封闭的模型时,Mistral 联合创始人 Arthur Mensch 却反其道而行,公开模型权重、押注开源,并直言:只有拿到权重,才真正谈得上安全与可控。这场与 Stripe 创始人 John Collison 的炉边谈话,透露了欧洲 AI 的另一种未来。
一个反直觉的判断:模型越开源,反而越安全
在这场对话里,Arthur Mensch 抛出了一个足以引发争议的观点:AI 安全的前提不是“封闭”,而是“可控”,而可控来自开源。在主流叙事中,GPT-4、Claude 这类闭源模型往往被视为“更安全”,因为它们不暴露权重。但 Arthur 的逻辑恰恰相反——如果你拿不到模型权重,你就无法真正理解模型在做什么,也无法把自己的审核标准、合规逻辑“编码进模型”。
他强调,只有当模型权重在你手中,你才能调整、微调、约束模型行为,甚至针对特定场景做内容安全设计。这也是 Mistral 坚持发布权重的根本原因之一。在他看来,安全不是一个外包给模型厂商的承诺,而是一种工程能力,而工程能力必须建立在可见、可控之上。
从 Chinchilla 到 Mistral:技术路线的分岔口
Arthur 并不是“理想主义式”地谈开源。他在 DeepMind 主导的 Chinchilla 论文,本身就是一篇改变行业训练范式的基础研究。也正因为如此,他对“规模”“算力”“成本效益曲线”异常敏感。
在 Mistral,他明确表示不会盲目追逐超大模型,而是从小模型起步,严格遵守成本效益曲线。这背后有一个现实判断:当模型真正进入企业生产环境,客户关心的第一顺位不是参数规模,而是成本、可控性和可定制性。
这也解释了为什么 Mistral 同时做两件事:一边构建“最好的开源模型家族”,一边也提供托管和专有方案。但它的“根”始终在开源上——成为一家“以开源为基础的核心大语言模型提供商”。
为什么 Llama 2 是机会,而不是威胁
当被问到 Meta 发布 Llama 2 时,Arthur 的反应并不是防御,而是欢迎。他认为,大模型一旦开放,真正的价值才开始释放:你可以重新训练、重复利用计算资源、根据自己的数据进行优化。
这正是开源社区的力量所在——不是“拿来即用”,而是“拿来改造”。Mistral 计划发布的一系列模型,也正是希望被社区使用、改进、再反馈。这种路径与闭源模型形成了鲜明对比:前者是生态,后者更像产品。
Arthur 甚至直言,Meta 与 Mistral 在理念上是一致的:开放并不削弱竞争力,反而放大了技术的长期价值。
幻觉、RAG、Embedding:问题不是一个模型能不能解决
关于大模型“幻觉”这一老大难问题,Arthur 给出的答案并不花哨,但非常工程化。他认为解决路径来自三方面的组合:长期训练中的知识注入、检索增强生成(RAG),以及通过微调让模型更严格地遵循上下文。
更重要的是,他强调生成模型必须与语义向量模型(Embedding)协同工作。这意味着,未来的 AI 系统不是一个“万能模型”,而是一整套模块化架构。而在这一过程中,开源再次成为优势:你可以替换组件、调整流程,而不是被一个黑箱模型的输出所支配。
欧洲 AI 的机会,不在复制硅谷
谈到法国乃至欧洲的 AI 复兴,Arthur 给出了一个清晰判断:这并不是偶然,而是教育体系与技术生态长期共振的结果。法国对数学和计算机科学的重视,为大模型时代提供了关键土壤。
但他也提醒,欧洲真正的机会不在于“复制美国模式”。数据隐私、监管环境、企业需求都不同,这也是 Mistral 从一开始就选择开源的重要原因。在他看来,好的监管应该提升可审计性,而不是设置硬性门槛——否则只会抑制创新。
至于 AGI?Arthur 选择避开这个语义陷阱。他更关心的是一件务实的事:把生成式 AI 做成真正可用、可控、为企业赋能的工具。
总结
这场对话释放的信号非常清晰:大模型的未来,并不只属于更大、更封闭的系统。开源不只是理想,更是一种成本、控制力和长期竞争力的综合选择。对从业者来说,这意味着两点行动建议:第一,别只学“怎么用 API”,而要真正理解模型、训练小模型,建立技术直觉;第二,关注开源生态的演进,它很可能决定下一波 AI 基础设施的走向。一个值得思考的问题是:当企业真正大规模部署 AI 时,你手里的模型,是黑箱,还是工具?
关键词: Mistral AI, 开源大模型, Arthur Mensch, AI安全, 欧洲AI
事实核查备注: Arthur Mensch 曾在 Google DeepMind 任研究员并参与 Chinchilla 论文;Mistral AI 的开源模型战略及发布权重的表述;Meta 发布 Llama 2 的时间与性质;对话发生于 Stripe AI Day Paris,发布时间 2023-10-06。