英伟达不再只卖芯片：它正在悄悄逼近GPT-4级模型

AI PM 编辑部 · 2024年10月18日 · 4 阅读 · AI/人工智能

计算机视觉大语言模型模型训练上下文窗口模型部署边缘AI GPU 开源模型 AI推理 Token

正在加载视频...

视频章节

一段看似平淡的AI新闻速读，透露出一个危险而清晰的信号：英伟达正在从“算力之王”升级为“全栈AI玩家”。从开源模型击穿GPT-4级基准，到数据中心、光子互连的底层革命，这期视频勾勒出AI权力结构正在发生的深层变化。

英伟达不再只卖芯片：它正在悄悄逼近GPT-4级模型

一段看似平淡的AI新闻速读，透露出一个危险而清晰的信号：英伟达正在从“算力之王”升级为“全栈AI玩家”。从开源模型击穿GPT-4级基准，到数据中心、光子互连的底层革命，这期视频勾勒出AI权力结构正在发生的深层变化。

为什么所有人都低估了英伟达的野心

这一期《AI Daily Brief》的开场并不在发布会，而是在一场私人AI晚宴。主持人提到，参与者包括投资人、大型企业和多位创业者，而整晚反复出现的一个问题是：英伟达到底有多强？

讨论的关键不只是“英伟达是AI浪潮中赚得最多的公司”，而是它正在“quietly moving across the entire stack”——悄无声息地向整个AI技术栈蔓延。过去，英伟达的角色很清晰：卖GPU，做底层算力。但现在，它显然不满足于“只做地基”。

这句话本身就是一个重要洞见。因为在AI产业里，谁控制模型，谁就控制应用；谁控制平台，谁就控制生态。如果英伟达既提供算力，又参与模型、软件、网络和数据中心设计，那么它的竞争对手将不再只是AMD，而是OpenAI、Anthropic，甚至云厂商本身。

这也为后面一条“几乎没有宣传的模型发布”埋下了伏笔：当一家原本不以模型闻名的公司，开始在模型层面正面挑战GPT-4级别系统时，产业格局已经发生变化。

一次“无声发布”：Neotron 70B为何震动圈内人

真正让这期视频引爆讨论的，是英伟达“几乎没有任何宣发”地上传了一个新模型到Hugging Face：Llama 3.1 Neotron 70B Instruct。

据主持人转述，这个模型在多个主流基准测试中，表现“apparently performs better than OpenAI GPT‑4o and Anthropic Claude 3.5 Sonnet”。如果属实，这不是一次小幅优化，而是一次级别跨越。

需要强调的是，这个模型并非从零训练，而是Meta开源的Llama 3.1之上的精炼版本。关键技术路径是RLHF——Reinforcement Learning from Human Feedback（人类反馈强化学习），也就是用人工偏好不断微调模型输出。这是目前顶级模型几乎必经的一步。

VentureBeat对此的评价很直接：这次发布“signals just how fast the AI landscape is shifting”。更重要的是，它挑战的并不只是性能榜单，而是商业模式本身。一个开源模型，如果在图像理解、复杂推理等维度逼近甚至超过闭源系统，企业是否还愿意为最前沿模型持续付费，就成了一个现实问题。

这种冲击来自“安静”。没有发布会，没有CEO站台，却直接把结果扔到社区里，让基准和开发者说话。

草莓里有几个R：一个小测试背后的大问题

模型发布后，社区仍在早期探索阶段。视频中提到一个具体而生动的案例：这个模型正确回答了“strawberry里有几个字母R”。

这是一个经典的LLM陷阱，因为它考验的不是语义理解，而是对拼写和字符级别的精确感知。VentureBeat观察到，Neotron 70B给出了“detailed and accurate response”，这被视为模型能力的重要信号。

当然，质疑也随之而来。X平台用户Sentdex重新跑了基准，认为模型“wasn't quite as good as claimed”。但即便如此，主持人指出，真正值得思考的问题并不是某一次跑分，而是模型正在迅速“commoditization（商品化）”。

他提出了一个关键追问：企业和个人是否永远愿意为state‑of‑the‑art买单？还是会出现一个拐点——“cheap but good enough models are frankly good enough”？

如果答案偏向后者，那么像英伟达这样同时掌握算力、模型和部署路径的公司，将在成本和规模上形成难以撼动的优势。

从芯片到光：算力战争的下一战场

视频后半段把镜头拉远，展示了支撑这些模型的“看不见的基础设施”。

首先是Crusoe Energy。这家最初以比特币挖矿设施闻名的公司，与Blue Owl Capital成立了一个34亿美元的合资项目，在德州Abilene建设一座200兆瓦数据中心。项目“100%长期租给一家《财富》100强的超大规模客户”，预计2025年上半年启用。

主持人直言：“that description could only fit”甲骨文为OpenAI建设的超级计算中心。更耐人寻味的是，为什么如此关键的项目会交给一家“相对默默无闻”的公司？答案可能在于Crusoe在液冷系统上的极端经验，这个集群将支持最多10万块GPU，并采用多项实验性设计。

紧接着是光子计算公司Lightmatter的故事。它刚完成4亿美元融资，目标是用“光而不是电线”来连接GPU。CEO Nick Harris的一句话极具画面感：“once you leave the rack… you go from high‑density interconnect to basically a cup on a string。”

当前即便是英伟达最先进的NVL72平台，也只能在机架内高效互连。跨机架、多层交换带来的延迟和能耗，正在成为百万GPU级系统的硬上限。Harris的判断是：“finally photonics is coming way faster than people thought。”

总结

这期视频真正传递的，不是一条模型新闻，而是一种结构性变化：英伟达正在从算力供应商，转变为深度参与模型、系统和基础设施的全栈玩家。与此同时，模型性能在快速商品化，真正的壁垒正在下沉到部署效率、能耗、互连和规模工程上。对从业者而言，这意味着关注点不能只停留在“下一个GPT”，而要理解整个AI机器是如何被搭建出来的。

关键词：英伟达，开源模型， Llama 3.1， GPT-4o， AI基础设施

事实核查备注：视频来源：The AI Daily Brief，发布时间：2024-10-18；模型名称：Llama 3.1 Neotron 70B Instruct；对比模型：GPT-4o、Claude 3.5 Sonnet；关键技术：RLHF；数据中心规模：200MW、最多10万GPU；融资金额：Lightmatter 4亿美元；英伟达平台：NVL72；公司名称：NVIDIA、Meta、OpenAI、Anthropic、Mistral AI、Crusoe Energy、Blue Owl Capital、Lightmatter

返回文章列表