GPU不是“芯片”,而是一种资产:Foundry眼中的AI云

AI PM 编辑部 · 2024年08月22日 · 1 阅读 · AI/人工智能

正在加载视频...

视频章节

在这期 No Priors 对话中,Foundry 创始人 Jared Quincy Davis 从 GPU 利用率切入,重新定义了“云”与“计算资源”的经济学含义。他提出 GPU 不是普通硬件,而是一种需要被精细运营的稀缺资产,并由此解释了为什么大多数 GPU 云长期被严重低估和低效使用。

GPU不是“芯片”,而是一种资产:Foundry眼中的AI云

在这期 No Priors 对话中,Foundry 创始人 Jared Quincy Davis 从 GPU 利用率切入,重新定义了“云”与“计算资源”的经济学含义。他提出 GPU 不是普通硬件,而是一种需要被精细运营的稀缺资产,并由此解释了为什么大多数 GPU 云长期被严重低估和低效使用。

为什么 Foundry 要“重做一遍云”

理解 Foundry 的起点很重要,因为它并不是在现有云计算模式上做微调,而是直接质疑了一个默认前提:通用云是否真的适合 AI。在节目一开始,Jared Quincy Davis 用一句非常直接的话定义了 Foundry——“a public Cloud built specifically for AI”。这句话的潜台词是,大多数云并不是为 AI 诞生的,而是后来“勉强适配”。

他指出,传统公有云的核心设计目标是 CPU 工作负载:稳定、可预测、按需扩展。但 AI 尤其是大模型训练与推理,完全不同。GPU 价格昂贵、供给稀缺、负载波动巨大,却仍然被当成普通计算实例来售卖。这种错配,直接导致了资源浪费。

Foundry 的出发点并不是“更便宜的 GPU”,而是更高效地使用 GPU。在 Jared 看来,如果云的底层经济模型不变,单纯堆更多显卡,只会放大低效。他强调,问题不在算力不够,而在于“我们根本没有把已经存在的算力用好”。

GPU 被严重低估的真相:利用率才是核心问题

为什么 GPU 云看起来永远不够用?Jared 把话题直接引向一个不太被公开讨论的指标:利用率。他提到,即便是在“最积极、利用率最高的案例”中,GPU 实际被有效使用的时间,依然远低于人们的直觉判断。

这背后的原因并不神秘。AI 任务往往是批量式、阶段性的:数据准备、调参、等待结果,这些环节都会让 GPU 空转。但在现有云模式下,用户仍然为整段时间付费。于是,一个看似“满载”的集群,实际上充满了碎片化的空闲。

Jared 在节目中反复强调,GPU 不是简单的“插上就算力翻倍”的芯片,而是一种需要被精细调度的资产。他暗示,如果把 GPU 当成房地产或金融资产来看待,就会意识到:空置本身就是最大的成本。这种视角,直接奠定了 Foundry 后续所有产品设计的逻辑基础。

重新理解“云”:弹性不只是扩容那么简单

对话中一个关键转折,是 Jared 把讨论从 GPU 拉回到“什么是云”。他说,这其实是一次关于云本质的再思考,而核心关键词只有一个:elasticity(弹性)。

在传统语境中,弹性意味着“需要时快速扩容,不用时缩回去”。但在 GPU 语境下,这远远不够。真正的弹性,是能否在时间维度、价格维度和负载类型上灵活匹配供需。否则,所谓弹性只是在资源充裕时显得慷慨,在紧缺时暴露僵化。

Foundry 的思路,是让 GPU 以更接近市场真实需求的方式被使用,而不是强迫用户适配固定套餐。这也解释了 Jared 为什么认为 GPU 是“unique asset”——它既不像 CPU 那样标准化,也不像存储那样可以无限复用。如果云不承认这种差异,低效几乎是必然结果。

从 spot 到市场结构:被忽视的 GPU 经济学

在节目后半段,主持人提到 Foundry 在平台上推出的新功能,尤其是围绕 spot 机制的更新。这并不是简单的价格策略,而是一次对 GPU 市场结构的尝试性修正。

Jared 指出,GPU 市场的“bootstrap”过程——也就是供给、需求和定价如何相互塑造——长期以来被严重低估甚至忽略。大多数讨论停留在“缺不缺卡”,却很少有人追问:卡是如何被分配的?在什么条件下被闲置?又是谁在为低效买单?

他并没有在节目中给出激进的结论,而是明确表达了一种态度:如果不正视 GPU 的经济属性,只从工程角度优化调度,问题永远解决一半。这种克制但锋利的判断,也恰恰是这次对话最有价值的地方。

总结

这期 No Priors 的价值,不在于宣布某个新产品,而在于提供了一套看待 AI 云的不同视角。Jared Quincy Davis 把 GPU 从“算力硬件”提升为“稀缺资产”,由此揭示了云计算在 AI 时代的结构性低效。对从业者而言,真正的启发是:当你觉得资源不够时,或许该先问一句——我们真的用好了吗?


关键词: Foundry, GPU利用率, AI云, 弹性计算, 算力经济学

事实核查备注: 视频人物:Jared Quincy Davis(Foundry CEO & Founder);节目:No Priors Ep.77;核心表述包括“a public Cloud built specifically for AI”“elasticity”“unique asset”;讨论主题集中在 GPU 利用率、云计算弹性、spot 机制与 GPU 市场结构;未涉及具体数字、型号或未明确提及的公司。