Mistral 不再只做开源：一个接近 GPT-4 的模型，和微软的关键一跃

AI PM 编辑部 · 2024年02月27日 · 2 阅读 · AI/人工智能

Sam Altman Token 模型训练 AI芯片 AI应用开源模型上下文窗口大语言模型模型部署对话AI

正在加载视频...

视频章节

法国 AI 明星公司 Mistral，发布了一个性能直逼 GPT-4 的新模型，却选择不上开源，而是牵手微软 Azure。这一刻，开源理想、商业现实和地缘政治同时撞在了一起。

Mistral 不再只做开源：一个接近 GPT-4 的模型，和微软的关键一跃

法国 AI 明星公司 Mistral，发布了一个性能直逼 GPT-4 的新模型，却选择不上开源，而是牵手微软 Azure。这一刻，开源理想、商业现实和地缘政治同时撞在了一起。

最反直觉的一幕：开源旗手，突然做了一个“闭源决定”

如果你过去半年关注过开源大模型，Mistral 几乎是绕不开的名字。它曾用 Mixtral、Mistral 7B 这种“直接丢磁力链接、不搞发布会”的方式，俘获了一整代开发者的心。

但这一次，最炸裂的点恰恰在于反差：Mistral 发布了新一代大模型 Mistral Large，性能“只在 GPT-4 之下”，却明确表示——不再开源，只通过 API 提供，而且首发在微软 Azure。

这对很多人来说是价值观层面的冲击。那个被视为 open source darling 的公司，第一次把“能卖钱”放在了“能下载”之前。更微妙的是，这不是偷偷摸摸的转向，而是和微软一起，堂而皇之地宣布合作。

Mistral Large 到底强在哪？数字背后的真正看点

从参数表面看，Mistral Large 的卖点很清晰：32K 上下文窗口，原生支持英语、法语、西班牙语、德语和意大利语。这里有一个容易被低估的点：原生多语言。

现在市面上大多数顶级模型，本质上还是“英语优先”，其他语言是迁移和对齐的结果。而 Mistral Large 从一开始就把多语言当成核心能力，这对欧洲企业、政府和跨国公司来说，吸引力极强。

性能对标上，Mistral Large 被认为介于 Claude 2 和 GPT-4 之间，超过 Gemini Pro。更关键的是成本结构：据披露，这个模型的训练成本大约在 2200 万美元左右。对比动辄数亿美元的传闻级预算，这几乎是在用“精打细算”挑战规模神话。

这也呼应了创始人 Arthur Mensch 一贯的理念：不是所有钱砸下去都会变成智能，有相当一部分只是被浪费在规模竞赛里。

从理想到现实：为什么这次必须牵手微软

如果只看情绪，社区里确实有人失落：有人说“磁力链接时代结束了”，也有人感叹“又一家独立 AI 初创被大厂引力捕获”。

但换个角度看，这一步几乎是必然。训练和部署顶级模型，需要的不只是工程能力，还有算力、芯片、电力，以及一个全球可交付的云平台。微软给的，不只是钱，还有 Azure 这个“现成的商业化通道”。

更重要的是，这并非突然变脸。早在 2023 年 11 月，Mistral 的 7B 模型就已经进入 Azure 模型目录。这次只是关系的升级，而不是价值观的背叛。

Arthur Mensch 自己也说得很直白：在坚持开源价值的同时，必须有“能卖的东西”。Mistral 的策略正在变得清晰——基础模型继续用开源建立生态，最顶级、最贵的能力，用闭源 API 支撑公司。

这不只是 Mistral 的选择，而是整个行业的缩影

把视角拉远，你会发现这件事的意义远不止一家公司的路线调整。

对微软来说，这是“去 OpenAI 单点依赖”的又一步。继 Databricks、各类开源模型之后，Mistral 成为新的选项，企业客户有了更多议价空间。

对欧洲来说，Mistral 是罕见的“本土希望”。法国政府在欧盟 AI 法案中的微妙立场，很大程度上就是在给 Mistral 这样的公司争取成长空间。

而对开发者来说，现实也在变得更清楚：未来不会只有一种“正确的模型”。你会在不同场景中，权衡性能、价格、合规、多语言能力，然后在 GPT-4、Claude、Mistral 之间切换。

顺带一提，Mistral 还顺手发布了自己的 ChatGPT 式前端 Le Chat——这更像是一个宣言：我们不只是模型供应商，也想直接触达用户。

总结

Mistral Large 的发布，真正重要的不是“它有没有超过 GPT-4”，而是它展示了一条现实可行的第三条路：不靠无限烧钱，也不被单一生态绑定。对从业者来说，现在是重新评估模型策略的时刻——是否真的需要最强模型？是否能用更便宜、更灵活的选择？一个很可能的未来是：GPT-4 仍然是天花板，但 Mistral 们，正在成为你日常工作的主力工具。你该做的，是尽早熟悉它们。

关键词： Mistral Large， GPT-4，开源模型，微软 Azure，大语言模型

事实核查备注：需要核查：Mistral Large 的训练成本约 2200 万美元；性能定位在 Claude 2 与 GPT-4 之间；32K 上下文窗口；原生支持的五种语言；微软是否持有 Mistral 的少数股权但未披露比例；发布时间 2024-02-27。

返回文章列表