英伟达跌21%并不危险，真正的胜负手藏在AI推理与Agent时代

AI PM 编辑部 · 2026年03月30日 · 64 阅读 · AI/人工智能

正在加载视频...

视频章节

当市场在问“英伟达是不是到头了”，这场长访谈却给出一个反直觉答案：真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给，这些被低估的变量，正在把英伟达推向一个更难被复制的位置。

当市场在问“英伟达是不是到头了”，这场长访谈却给出一个反直觉答案：真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给，这些被低估的变量，正在把英伟达推向一个更难被复制的位置。

访谈里抛出的第一个炸点是：英伟达“看起来很危险”的时刻，反而最像机会。一年前，市场同样被一连串宏观变量吓到——关税、地缘政治、战争阴影、油价波动，情绪先行，基本面靠后。结果大家都知道了。

这次的剧本几乎复刻：股价回撤、唱空声四起，甚至开始讨论“AI算力是不是过剩”。但访谈者明确指出，这些担忧更多来自市场对周期的误读，而不是需求真的消失。英伟达的问题不是“没人要GPU”，而是“大家要得太多、太快”。当你把股价波动和真实算力需求放在同一张图上看，会发现两条线根本不在一个时间维度里。

如果说训练模型曾是英伟达的高光时刻，那现在，真正的主战场正在转向推理（Inference）。访谈中反复强调一个变化：AI Agent、代码生成助手、自动化工作流正在把GPU从“一次性训练工具”，变成“全天候生产力机器”。

这带来两个连锁反应。第一，推理需求是持续性的，不是项目制的；第二，它对延迟、带宽、内存堆叠的要求，反而更挑剔。于是你会看到一个荒诞又真实的现象：GPU像限量球鞋一样被抢，甚至出现“机器人抢GPU”的说法。这不是泡沫，而是供需错配在现实世界的投射。

谈到Grok相关合作时，访谈把焦点放在黄仁勋的长期策略，而不是单一订单。这里的类比很有意思：Melanox。当年很多人只看到英伟达卖芯片，却忽略了它通过网络、互连，把自己嵌进数据中心的“血管系统”。

Grok与推理工作负载的混合，正在重复类似路径：更大的上下文窗口、更激进的内存堆叠、更贴近真实应用的优化。一旦AI真正进入“liftoff”阶段，谁掌握了这些底层组合拳，谁就更难被替代。这也是为什么访谈认为，英伟达的护城河不只是CUDA，而是一整套被验证过的工程体系。

很多空头忽略了一个现实：问题不在“谁能设计芯片”，而在“谁能稳定把它造出来”。访谈直言，真正的瓶颈在供给侧——TSMC的资本开支、晶圆分配、先进制程的节奏，都会决定行业上限。

Intel、Samsung被提及，但语气非常克制。不是没人想追，而是先进制程像做菜：食谱公开，火候、经验和团队才是决定因素。TSMC积累的是几十年的人才密度与工艺细节，这种复杂度本身，就是英伟达间接享有的壁垒。

访谈后半段把视角拉到更大的系统层面。AI Agent不仅吃GPU，还会推高CPU编排、调度和控制层的需求，尤其是在ARM架构和超大规模云厂商中。这意味着，所谓“算力过剩”，很可能只是单点视角下的误判。

从XAI、SpaceX的卫星算力设想，到Neocloud模式，再到CoreWeave的定价与折旧争议，讨论的核心只有一个：Token需求是否持续增长。如果答案是肯定的，那么纵向整合的AI Agent，反而会把算力资产的生命周期拉得更长，而不是更短。

这场访谈给AI从业者的最大启发是：不要用“训练时代”的眼镜，看“推理与Agent时代”的公司。英伟达的真正优势，不在某一代GPU，而在它如何提前押注工作负载的变化，并把供应链、软件和系统复杂度变成别人学不会的东西。

如果你在做产品、投资或架构设计，现在值得问自己的问题是：你的业务假设，是否已经把持续推理、Agent编排和算力供给不确定性算进去？下一轮分化，可能不是发生在模型之间，而是发生在“谁能把模型真正跑起来”之间。

关键词：英伟达， AI推理， AI Agent， GPU供给，黄仁勋

事实核查备注：需要核查：英伟达股价下跌21%的时间点与背景；Grok相关合作的具体形式；Melanox类比是否为原话；TSMC产能与晶圆分配的具体限制；CoreWeave定价与折旧讨论的具体案例。