英伟达跌21%并不危险,真正的胜负手藏在AI推理与Agent时代

AI PM 编辑部 · 2026年03月30日 · 25 阅读 · AI/人工智能

正在加载视频...

视频章节

当市场在问“英伟达是不是到头了”,这场长访谈却给出一个反直觉答案:真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给,这些被低估的变量,正在把英伟达推向一个更难被复制的位置。

英伟达跌21%并不危险,真正的胜负手藏在AI推理与Agent时代

当市场在问“英伟达是不是到头了”,这场长访谈却给出一个反直觉答案:真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给,这些被低估的变量,正在把英伟达推向一个更难被复制的位置。

股价下跌21%,却更像一年前的重演

访谈里抛出的第一个炸点是:英伟达“看起来很危险”的时刻,反而最像机会。一年前,市场同样被一连串宏观变量吓到——关税、地缘政治、战争阴影、油价波动,情绪先行,基本面靠后。结果大家都知道了。

这次的剧本几乎复刻:股价回撤、唱空声四起,甚至开始讨论“AI算力是不是过剩”。但访谈者明确指出,这些担忧更多来自市场对周期的误读,而不是需求真的消失。英伟达的问题不是“没人要GPU”,而是“大家要得太多、太快”。当你把股价波动和真实算力需求放在同一张图上看,会发现两条线根本不在一个时间维度里。

被低估的不是训练,而是正在爆炸的AI推理

如果说训练模型曾是英伟达的高光时刻,那现在,真正的主战场正在转向推理(Inference)。访谈中反复强调一个变化:AI Agent、代码生成助手、自动化工作流正在把GPU从“一次性训练工具”,变成“全天候生产力机器”。

这带来两个连锁反应。第一,推理需求是持续性的,不是项目制的;第二,它对延迟、带宽、内存堆叠的要求,反而更挑剔。于是你会看到一个荒诞又真实的现象:GPU像限量球鞋一样被抢,甚至出现“机器人抢GPU”的说法。这不是泡沫,而是供需错配在现实世界的投射。

黄仁勋的算盘:从Grok到“Melanox式”的复制

谈到Grok相关合作时,访谈把焦点放在黄仁勋的长期策略,而不是单一订单。这里的类比很有意思:Melanox。当年很多人只看到英伟达卖芯片,却忽略了它通过网络、互连,把自己嵌进数据中心的“血管系统”。

Grok与推理工作负载的混合,正在重复类似路径:更大的上下文窗口、更激进的内存堆叠、更贴近真实应用的优化。一旦AI真正进入“liftoff”阶段,谁掌握了这些底层组合拳,谁就更难被替代。这也是为什么访谈认为,英伟达的护城河不只是CUDA,而是一整套被验证过的工程体系。

供给才是最大变量:TSMC、晶圆与不可复制的复杂度

很多空头忽略了一个现实:问题不在“谁能设计芯片”,而在“谁能稳定把它造出来”。访谈直言,真正的瓶颈在供给侧——TSMC的资本开支、晶圆分配、先进制程的节奏,都会决定行业上限。

Intel、Samsung被提及,但语气非常克制。不是没人想追,而是先进制程像做菜:食谱公开,火候、经验和团队才是决定因素。TSMC积累的是几十年的人才密度与工艺细节,这种复杂度本身,就是英伟达间接享有的壁垒。

当CPU、Agent和Neocloud开始互相推高需求

访谈后半段把视角拉到更大的系统层面。AI Agent不仅吃GPU,还会推高CPU编排、调度和控制层的需求,尤其是在ARM架构和超大规模云厂商中。这意味着,所谓“算力过剩”,很可能只是单点视角下的误判。

从XAI、SpaceX的卫星算力设想,到Neocloud模式,再到CoreWeave的定价与折旧争议,讨论的核心只有一个:Token需求是否持续增长。如果答案是肯定的,那么纵向整合的AI Agent,反而会把算力资产的生命周期拉得更长,而不是更短。

总结

这场访谈给AI从业者的最大启发是:不要用“训练时代”的眼镜,看“推理与Agent时代”的公司。英伟达的真正优势,不在某一代GPU,而在它如何提前押注工作负载的变化,并把供应链、软件和系统复杂度变成别人学不会的东西。

如果你在做产品、投资或架构设计,现在值得问自己的问题是:你的业务假设,是否已经把持续推理、Agent编排和算力供给不确定性算进去?下一轮分化,可能不是发生在模型之间,而是发生在“谁能把模型真正跑起来”之间。


关键词: 英伟达, AI推理, AI Agent, GPU供给, 黄仁勋

事实核查备注: 需要核查:英伟达股价下跌21%的时间点与背景;Grok相关合作的具体形式;Melanox类比是否为原话;TSMC产能与晶圆分配的具体限制;CoreWeave定价与折旧讨论的具体案例。