把200B模型搬到桌下:Jetson Spark让本地LLM不再是玩具
如果你还觉得大模型只能在云端跑,这场NVIDIA的实测会直接打脸:14B模型本地20 token/s,首token快3.4倍。更重要的不是跑得多大,而是开发者终于能在自己桌边,摸清真实的工程边界。
如果你还觉得大模型只能在云端跑,这场NVIDIA的实测会直接打脸:14B模型本地20 token/s,首token快3.4倍。更重要的不是跑得多大,而是开发者终于能在自己桌边,摸清真实的工程边界。
当市场在问“英伟达是不是到头了”,这场长访谈却给出一个反直觉答案:真正的增长引擎才刚启动。AI推理、Agent、上下文窗口、算力供给,这些被低估的变量,正在把英伟达推向一个更难被复制的位置。
如果你还把 NVIDIA 当成一家“卖 GPU 的公司”,那你已经落后了至少一个时代。在这期 Lex Fridman 的长谈中,黄仁勋用近乎残酷的坦诚,讲清了 NVIDIA 为何押上整个组织,从芯片公司进化为“AI 工厂设计商”,以及这场转型对所有 AI 从业者意味着什么。
当所有人盯着英伟达的GTC狂欢时,三星悄悄砸下700亿美元扩建晶圆厂;另一边,苹果被嘲“AI落后”,却依然把钱赚到手软。这期 TBPN 抛出了一个反直觉判断:AI时代,真正决定胜负的,可能既不是模型,也不是发布会。
所有人都在盯着GTC的算力参数,但真正让AI圈炸锅的,是英伟达一句“重启对华AI芯片生产”,以及苹果突然出手封杀Vibe Coding。前者关乎全球算力格局,后者可能改变开发者生态。这一期TBPN,把几条看似分散的新闻,连成了一条清晰的产业暗线。
英伟达正在重启对华AI芯片生产,而最反直觉的是:这可能并不是美国输掉AI竞赛的开始,反而是降低全球风险的理性选择。这期TBPN视频给出了一个让很多AI从业者都会皱眉、但又无法忽视的论证路径。
这期 TBPN 最反直觉的信号只有一个:OpenAI 正在系统性结束“副本任务”。从内部团队收缩,到和 TPG 组建合资公司,再到 mini / nano 模型路线的明确化,所有零散动作突然拼成了一条清晰主线——AI 公司不再炫技,而是开始算账了。
这周的英伟达GTC大会,真正的爆点不是更猛的训练GPU,而是一次方向性的转弯:英伟达首次正面切入AI推理、代理和算力基础设施全栈。与此同时,AI Agent被写进27家上市公司的“风险清单”,字节的视频模型被好莱坞按下暂停键。AI行业,正在集体换挡。
一个几乎“全是AI在自嗨”的社交网络,被Meta收了。外界嘲讽这是周末vibe coding的泡沫,但真正值得警惕的,是Meta为什么偏偏在这个时间点出手,以及这件事如何重新定义“注意力”和“平台”的含义。
当字节跳动被曝拿到英伟达最新Blackwell芯片、而硅谷却在反思“为什么我们总爱拉低最成功的人”,这期TBPN抛出了一个不太舒服但极其重要的信号:技术竞争、文化心态和资源分配,正在一起重塑全球科技格局。