Mistral 不再只做开源:一个接近 GPT-4 的模型,和微软的关键一跃

AI PM 编辑部 · 2024年02月27日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

法国 AI 明星公司 Mistral,发布了一个性能直逼 GPT-4 的新模型,却选择不上开源,而是牵手微软 Azure。这一刻,开源理想、商业现实和地缘政治同时撞在了一起。

Mistral 不再只做开源:一个接近 GPT-4 的模型,和微软的关键一跃

法国 AI 明星公司 Mistral,发布了一个性能直逼 GPT-4 的新模型,却选择不上开源,而是牵手微软 Azure。这一刻,开源理想、商业现实和地缘政治同时撞在了一起。

最反直觉的一幕:开源旗手,突然做了一个“闭源决定”

如果你过去半年关注过开源大模型,Mistral 几乎是绕不开的名字。它曾用 Mixtral、Mistral 7B 这种“直接丢磁力链接、不搞发布会”的方式,俘获了一整代开发者的心。

但这一次,最炸裂的点恰恰在于反差:Mistral 发布了新一代大模型 Mistral Large,性能“只在 GPT-4 之下”,却明确表示——不再开源,只通过 API 提供,而且首发在微软 Azure。

这对很多人来说是价值观层面的冲击。那个被视为 open source darling 的公司,第一次把“能卖钱”放在了“能下载”之前。更微妙的是,这不是偷偷摸摸的转向,而是和微软一起,堂而皇之地宣布合作。

Mistral Large 到底强在哪?数字背后的真正看点

从参数表面看,Mistral Large 的卖点很清晰:32K 上下文窗口,原生支持英语、法语、西班牙语、德语和意大利语。这里有一个容易被低估的点:原生多语言。

现在市面上大多数顶级模型,本质上还是“英语优先”,其他语言是迁移和对齐的结果。而 Mistral Large 从一开始就把多语言当成核心能力,这对欧洲企业、政府和跨国公司来说,吸引力极强。

性能对标上,Mistral Large 被认为介于 Claude 2 和 GPT-4 之间,超过 Gemini Pro。更关键的是成本结构:据披露,这个模型的训练成本大约在 2200 万美元左右。对比动辄数亿美元的传闻级预算,这几乎是在用“精打细算”挑战规模神话。

这也呼应了创始人 Arthur Mensch 一贯的理念:不是所有钱砸下去都会变成智能,有相当一部分只是被浪费在规模竞赛里。

从理想到现实:为什么这次必须牵手微软

如果只看情绪,社区里确实有人失落:有人说“磁力链接时代结束了”,也有人感叹“又一家独立 AI 初创被大厂引力捕获”。

但换个角度看,这一步几乎是必然。训练和部署顶级模型,需要的不只是工程能力,还有算力、芯片、电力,以及一个全球可交付的云平台。微软给的,不只是钱,还有 Azure 这个“现成的商业化通道”。

更重要的是,这并非突然变脸。早在 2023 年 11 月,Mistral 的 7B 模型就已经进入 Azure 模型目录。这次只是关系的升级,而不是价值观的背叛。

Arthur Mensch 自己也说得很直白:在坚持开源价值的同时,必须有“能卖的东西”。Mistral 的策略正在变得清晰——基础模型继续用开源建立生态,最顶级、最贵的能力,用闭源 API 支撑公司。

这不只是 Mistral 的选择,而是整个行业的缩影

把视角拉远,你会发现这件事的意义远不止一家公司的路线调整。

对微软来说,这是“去 OpenAI 单点依赖”的又一步。继 Databricks、各类开源模型之后,Mistral 成为新的选项,企业客户有了更多议价空间。

对欧洲来说,Mistral 是罕见的“本土希望”。法国政府在欧盟 AI 法案中的微妙立场,很大程度上就是在给 Mistral 这样的公司争取成长空间。

而对开发者来说,现实也在变得更清楚:未来不会只有一种“正确的模型”。你会在不同场景中,权衡性能、价格、合规、多语言能力,然后在 GPT-4、Claude、Mistral 之间切换。

顺带一提,Mistral 还顺手发布了自己的 ChatGPT 式前端 Le Chat——这更像是一个宣言:我们不只是模型供应商,也想直接触达用户。

总结

Mistral Large 的发布,真正重要的不是“它有没有超过 GPT-4”,而是它展示了一条现实可行的第三条路:不靠无限烧钱,也不被单一生态绑定。对从业者来说,现在是重新评估模型策略的时刻——是否真的需要最强模型?是否能用更便宜、更灵活的选择?一个很可能的未来是:GPT-4 仍然是天花板,但 Mistral 们,正在成为你日常工作的主力工具。你该做的,是尽早熟悉它们。


关键词: Mistral Large, GPT-4, 开源模型, 微软 Azure, 大语言模型

事实核查备注: 需要核查:Mistral Large 的训练成本约 2200 万美元;性能定位在 Claude 2 与 GPT-4 之间;32K 上下文窗口;原生支持的五种语言;微软是否持有 Mistral 的少数股权但未披露比例;发布时间 2024-02-27。