130亿美元级并购背后:企业为什么开始“自己养”大模型

AI PM 编辑部 · 2023年06月28日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

Databricks 13亿美元收购 MosaicML,只是一个开始。真正的变化是:企业不再迷信“最强大模型”,而是集体转向“可控、私有、可定制”的 AI 路线。这场并购潮,正在悄悄重塑 AI 的权力结构。

130亿美元级并购背后:企业为什么开始“自己养”大模型

Databricks 13亿美元收购 MosaicML,只是一个开始。真正的变化是:企业不再迷信“最强大模型”,而是集体转向“可控、私有、可定制”的 AI 路线。这场并购潮,正在悄悄重塑 AI 的权力结构。

13亿美元买的不是模型,而是“控制权”

如果你以为 Databricks 花 13 亿美元买 MosaicML,是为了追赶 GPT-4,那你可能看错了方向。

Databricks 的核心身份是“Lakehouse”厂商:一手抓海量非结构化数据,一手抓结构化分析。而 MosaicML 带来的,并不是一个现成的聊天机器人,而是一整套“让企业自己训练大模型”的能力。

CEO Ali Ghodsi 说得很直白:几乎每一个客户都在问同一个问题——“我能不能用自己的数据,训练自己的模型,并且把数据和 IP 留在自己手里?”这句话点破了当前企业 AI 的最大焦虑:不是模型不够聪明,而是数据不敢交出去。

在 ChatGPT 掀起第一波通用大模型浪潮之后,企业市场迅速冷静下来。安全、合规、数据隔离,压倒了“参数规模”和“排行榜”。Databricks + MosaicML 的组合,本质上是在告诉企业:你不需要把命运交给 OpenAI,也不必等一个‘企业版奇迹’,你可以自己来。

这也是为什么这笔并购的信号意义,远大于 13 亿美元本身。

开源的十字路口:更小的模型,反而更危险?

争议也随之而来。

MosaicML 在被收购前,是开源社区的明星。他们的模型曾在只有 300 亿参数的情况下,跑赢 1750 亿参数的 GPT-3——更便宜、更容易在本地硬件部署,这对开发者来说几乎是“理想形态”。

问题在于:被 Databricks 收购后,它还会继续开源吗?

如果 MosaicML 逐步闭源,这将是对开源大模型运动的一次重击。因为它恰恰证明了一件事:并不是只有“巨无霸模型”才有价值,小而精、可控、可私有化的模型,才是企业真正愿意掏钱的方向。

更微妙的是竞争格局。有人已经把这场并购解读为“基础模型层的争夺战”:Databricks、Snowflake、OpenAI,谁能成为企业默认的大模型底座?答案还远未揭晓,但可以确定的是——企业正在用脚投票,离通用 API 越远,离定制化越近。

并购潮真正的主线:AI 不再是功能,而是护城河

如果说 Databricks 的案例是“底层之争”,那另外两起并购则揭示了更现实的一条路径。

金融科技平台 Ramp 收购了客服 AI 公司 Cohere.io;汤森路透用 6.5 亿美元现金买下法律 AI 公司 Casetext。一个关键词贯穿其中:速度。

对成熟公司来说,自己从零搭 AI 团队,太慢、太贵、风险太高。直接买下已经跑通场景的 AI 创业公司,几乎成了最优解。尤其是在法律、金融、客服这种高价值、高壁垒行业,AI 已经从“加分项”变成了产品本身。

Casetext 的 CoCounsel 基于 GPT-4,能做法律检索、文书分析、合同审查——这不是一个 Demo,而是直接影响律师工作流的工具。汤森路透此前就放话:未来几年,AI 投资预算是 100 亿美元级别。

这意味着什么?未来你几乎每天都会看到新的 AI 并购新闻,而真正重要的不是价格,而是:谁把 AI 变成了不可替代的核心能力。

普通人已经站队,只是你没注意到

The Verge 的一项调查,给这场技术竞赛补上了“群众基础”的一块拼图。

57% 的人听说过或用过 ChatGPT,Bing Chat、Snap 的 My AI 甚至超过了 Google Bard。更有意思的是:Midjourney 的知名度略高于 Stable Diffusion——产品体验,正在压过“是否开源”的技术信仰。

使用方式也很现实:68% 用来回答问题,54% 用来头脑风暴,写作、编程、设计、修图全部挤在 25%-35% 区间。AI 没有一个“杀手级用途”,但已经无处不在。

同时,人们也并非盲目乐观。对监管、数据标注、深度伪造的担忧高度一致——既兴奋,又焦虑,成了这个时代对 AI 最真实的情绪。

总结

这波并购潮传递出的核心信号只有一个:AI 的竞争重心,正在从“谁的模型最大”,转向“谁能被信任、被控制、被深度嵌入业务”。

如果你是从业者,这意味着两件事:第一,懂微调、懂私有化部署、懂行业数据的人,价值会持续上升;第二,单纯追热点模型,而不理解业务场景,很快会被边缘化。

接下来值得思考的问题是:当每一家大公司都能“自己养模型”,通用大模型的护城河还剩多少?而你,站在这条产业链的哪一层?


关键词: AI并购, 大语言模型, 企业AI, 开源模型, 生成式AI

事实核查备注: Databricks 收购 MosaicML 金额为 13 亿美元;MosaicML 模型参数规模约 300 亿,对比 GPT-3 的 1750 亿;汤森路透收购 Casetext 金额为 6.5 亿美元现金;Casetext 的 CoCounsel 基于 GPT-4;The Verge 调查样本量约 2000 人;视频发布时间为 2023-06-28