从DeepMind到Mistral：Arthur Mensch谈开源模型如何改写AI规则

AI PM 编辑部 · 2023年11月09日 · 9 阅读 · AI/人工智能

正在加载视频...

视频章节

Mistral AI CEO Arthur Mensch在《No Priors》中分享了他离开DeepMind、创立开源AI公司的关键思考：为什么开源模型正在重塑技术版图，以及他对模型规模、数据、与AI安全争议的不同判断。

从DeepMind到Mistral：Arthur Mensch谈开源模型如何改写AI规则

Mistral AI CEO Arthur Mensch在《No Priors》中分享了他离开DeepMind、创立开源AI公司的关键思考：为什么开源模型正在重塑技术版图，以及他对模型规模、数据、与AI安全争议的不同判断。

为什么开源模型在一年内改变了AI版图

这一段对理解Mistral的存在意义至关重要。Arthur Mensch一开场就指出：“open source AI models have completely changed the landscape of technology over the past year。”这并不是一句口号，而是他做出职业转向的直接原因。在他看来，开源模型让研究者和创业者第一次站在了几乎同一起跑线上，创新速度不再完全由算力和资本规模决定。

他强调，开源并不只是“把代码放出来”，而是一种价值选择。模型、方法和结果的可验证性，让整个生态能够更快纠错和迭代。这也是他在创立Mistral时确立的核心原则之一：让最强的模型能力尽可能开放，而不是被少数公司封装在黑盒里。

这背后还有一个隐含判断：AI的长期价值不会只来自某一个封闭系统，而是来自一个可组合、可扩展的技术网络。开源模型，正在为这个网络奠定基础。

离开DeepMind：一次看似冒险但理性的决定

为什么一个在Google DeepMind工作多年的研究者，会在生成式AI爆发前后选择离开？Arthur回忆说，六个月前他们上一次见面时，他刚刚做出这个决定。当时外界并不确定开源大模型是否真的能与闭源系统竞争。

他用自己“10 years in machine learning”的经验做支撑，提出一个工程视角的判断：在相同计算资源下，方法和架构的改进，几乎总能带来“a pure win”——更好的模型效果。这意味着，规模并不是唯一解法。

事实证明，他们一开始“didn't go far enough”。公司成立后的早期成果，反而让团队意识到：如果目标是改变行业规则，就必须比最初设想走得更远。这成为Mistral后来持续训练更大模型的重要转折点。

模型、数据与训练：真正拉开差距的地方

很多人对Mistral的印象停留在“开源”，但Arthur反复强调，真正困难的部分在于训练过程本身。他提到，外界对他们的成果“really impressed”，但这并非偶然，而是源于团队在模型训练和数据处理上的持续进步。

当被问到数据策略时，他的回答并不炫技，而是务实：团队正在“getting better and better at that”。这里的潜台词是，数据质量、过滤方法以及训练流程的细节，才是决定模型上限的关键因素。

同时，他也坦率承认：“we are indeed training larger models for sure。”这并不是对规模崇拜的妥协，而是在方法论成熟之后，顺势而为的选择。规模是放大器，而不是起点。

关于AI安全：反对空谈，强调可执行机制

讨论走到后半段，不可避免地触及AI安全。Arthur对当前公共讨论持明显保留态度。他指出，如果仔细看主流叙事，会发现很多担忧并不“pragmatic”，甚至与现实风险脱节。

他质疑任意的算力限制，以及把注意力过度放在假设性的生物风险上。在他看来，如果某些风险本身并不现实，那么围绕它们设计的政策，只会“detrimental to life for sure”。

相较之下，他更关心可落地的技术路径，比如“modular mechanisms to control the model”。当人们谈论安全时，他希望看到的是工程问题和研究方向，而不是抽象恐惧。这也是Mistral正在探索的一个重要研究方向。

总结

Arthur Mensch的分享让人看到一种少见的冷静：既不神话开源，也不迷信规模。他从个人经历出发，解释了为什么开源模型能够在短时间内改变行业结构，以及为什么真正的差距来自方法、数据和训练细节。对读者而言，这不仅是一次关于Mistral的理解，更是一种判断AI未来走向的思维框架。

关键词： Mistral，开源模型，机器学习，模型训练， AI安全

事实核查备注： Arthur Mensch 为 Mistral AI CEO；曾任职 Google DeepMind；观点包括开源模型改变技术版图、在相同算力下方法改进带来更好模型；Mistral 确实在训练更大的模型；讨论涉及 AI 安全、算力限制与模块化控制机制。

返回文章列表