每秒5亿Token背后:AI算力、人才与芯片的全面升级战

AI PM 编辑部 · 2025年10月14日 · 14 阅读 · AI/人工智能

正在加载视频...

视频章节

Google每秒处理5亿个AI Token、Meta掀起十亿美元级别的人才争夺、xAI押注世界模型、全球芯片战骤然升温。这期《AI Daily Brief》串起了当下AI产业最真实的主线:规模、资源与地缘政治,正在同时决定技术进化的速度与方向。

每秒5亿Token背后:AI算力、人才与芯片的全面升级战

Google每秒处理5亿个AI Token、Meta掀起十亿美元级别的人才争夺、xAI押注世界模型、全球芯片战骤然升温。这期《AI Daily Brief》串起了当下AI产业最真实的主线:规模、资源与地缘政治,正在同时决定技术进化的速度与方向。

1. 每秒5亿Token:AI规模进入“人类直觉失效区”

为什么Token规模如此重要?因为它几乎是衡量一个AI平台真实使用强度和商业落地程度的最硬指标。视频一开始就抛出了一个让人失去直觉的数字:Google现在每个月要处理1.3千万亿(1.3 quadrillion)个Token,用于支撑旗下AI产品。

主持人回顾了一个关键转折点:在今年5月到7月之间,Google的月度Token处理量从480万亿暴涨到980万亿,短短几个月增长了约104%。他当时的推测是,这一跃迁很可能来自真实部署场景的扩张,尤其是AI代码生成场景——这类应用天然“吞Token”,远比简单问答密集得多。

为了让这个数字更可感,Google DeepMind CEO Demis Hassabis亲自给出了一个“人类尺度”的换算:1.3千万亿Token,相当于“每秒处理5亿Token,或每小时1.8万亿Token”。正如主持人所说,在这个量级上,“这些数字本身已经有点难以理解了”。但有一点是明确的:AI的真实使用量正在持续、快速、不可逆地上升。

这不仅是算力的胜利,也是产品被真正用起来的信号。当Token曲线开始指数级上扬,意味着AI已经不再只是实验室里的能力展示,而是进入了高频、刚需、规模化的生产环境。

2. Gemini的加速追赶:一场正在收紧的双雄竞赛

规模增长并非抽象存在,它正在直接反映到产品竞争上。视频引用了SimilarWeb最新的流量报告:在9月,Gemini网页端流量环比增长46%,远超第二名Perplexity的14%多一点,成为当月增长最猛的AI平台。

主持人特别提醒,这类数据“只能轻度参考”——它只统计网页端流量,不包括移动端,而像Grok这样的产品,主要使用场景在X平台内,因此网页流量下降7.4%并不等同于真实使用下滑。但即便扣除这些偏差,一个结论依然成立:Gemini正在以惊人的速度增长。

更具戏剧性的是,Gemini一度在应用商店排名上超过了ChatGPT,虽然随后被Sora带动的热潮重新拉开差距,但这已经足以说明竞争态势正在变化。主持人用了一句很有画面感的判断:“ChatGPT和Gemini之间的比赛,正在变得越来越紧。”

结尾处,他抛出了一个耐人寻味的问题:当Gemini 3.0 Flash和Gemini 3.0 Pro在几周内发布,会发生什么?这不是单纯的版本更新,而是Token规模、用户增长和模型能力叠加后的下一次加速器。

3. 十亿美元人才战:Meta为什么还能继续挖人?

如果说算力决定上限,那人才决定方向。视频的第二个故事,聚焦在Meta再度“出手”挖走顶级AI研究员这件事上。

据《华尔街日报》报道,Thinking Machines Lab(TML)的创始成员之一Andrew Tullk已离职并加入Meta的“超级智能实验室”。Tullk的履历极具象征意义:他在2024年离开OpenAI,与Mira Murati等人共同创立TML;而在此之前,他曾在Meta担任机器学习工程师长达十年。

更具戏剧性的是背景传闻。早在8月,《华尔街日报》就曾报道称,Tullk拒绝了一份为期六年、总额高达15亿美元的Meta报价。这篇报道迅速走红,成为“扎克伯格亲自下场、用十位数合同抢AI人才”的标志性案例。Meta当时回应称这一说法“夸张且不准确”,但同时也承认,薪酬与股价表现挂钩——这在主持人口中,被形容为“一种并非完全否认的否认”。

主持人提出了一个比金钱更耐人寻味的解释:即便TML是硅谷史上融资最充足的早期AI创业公司之一,它在算力和基础设施上的资源,依然只是Meta的一小部分。当研究方向越来越依赖大规模计算时,资源差距本身,可能就足以改变个人选择。正如视频最后那句调侃所说:“Llama 5最好真的能交付成果。”

4. 世界模型与芯片战:AI竞争的外溢效应

视频的后半段,将视角从公司竞争拉到了技术路径和地缘政治。首先是xAI加入“世界模型”赛道。世界模型指的是让AI理解和模拟真实世界运行规则的模型,是训练机器人和具身智能的关键技术。

《金融时报》披露,xAI从NVIDIA挖走了两名研究员,加入相关研发。NVIDIA通过Omniverse平台,已在用于模拟训练的世界模型上处于领先地位;Google和Fei-Fei Li的World Labs也取得了重要进展。主持人指出,xAI的独特机会在于:它既能做世界模型,又可能直接和真实的具身AI结合。

但Elon Musk显然在寻找更快的回报路径。他在X上表示,xAI游戏工作室将在年底前发布一款“优秀的AI生成游戏”。视频提到,xAI正在招聘一个“视频游戏导师”,教Grok如何制作游戏。一位评论者总结得很到位:“世界模型是为Optimus准备的长期技术,但游戏,能带来近得多的收入。”

最后,镜头拉到更宏观的层面:芯片战。中国开始在港口严查NVIDIA H20和RTX Pro 6000D等合规芯片的进口,而荷兰政府则首次动用1952年的法律,接管中资控股的芯片公司Nexperia。正如Endgame Macro所说,这已经不是单一监管事件,而是“全球科技权力斗争的前线时刻”。AI的竞争,正在同时发生在模型、人才、算力与国家之间。

总结

从每秒5亿Token的规模爆炸,到十亿美元级别的人才流动,再到世界模型与芯片管制,视频传递了一个清晰信号:AI已经进入“全要素竞争”阶段。技术突破不再孤立发生,它同时依赖算力、资本、组织和地缘环境。对读者而言,理解这些交织的力量,比记住单一模型参数更重要,因为它们正在决定,下一次真正的AI跃迁会发生在哪里。


关键词: Token规模, Gemini, AI人才战争, 世界模型, AI芯片

事实核查备注: Google月处理1.3 quadrillion Token;Demis Hassabis换算为每秒5亿Token、每小时1.8万亿Token;Gemini 9月网页流量增长46%;Perplexity约14%;Grok网页流量下降7.4%;Andrew Tullk为Thinking Machines Lab创始成员之一;曾有媒体报道Meta提出6年15亿美元报价;xAI从NVIDIA招聘研究员开发世界模型;NVIDIA相关芯片包括H20与RTX Pro 6000D;荷兰政府接管中资控股芯片公司Nexperia。