客户服务模型干翻GPT‑5.4:垂直AI时代真的来了
一家做客服的软件公司,训练了一个“只会干一件事”的模型,却在真实指标上击败了GPT‑5.4和Opus 4.5。这不是个例,而是一个信号:在2026年,AI性能的主战场,正在从“更大的通用模型”转向“更狠的垂直模型”。
一家做客服的软件公司,训练了一个“只会干一件事”的模型,却在真实指标上击败了GPT‑5.4和Opus 4.5。这不是个例,而是一个信号:在2026年,AI性能的主战场,正在从“更大的通用模型”转向“更狠的垂直模型”。
OpenAI 做了一个极不“OpenAI”的决定:主动放弃 Sora 视频生成,终止和迪士尼的合作,把算力、组织和叙事全部押到一个方向——Work AGI。这不是一次产品调整,而是一场路线收缩的宣言。
如果你还把 NVIDIA 当成一家“卖 GPU 的公司”,那你已经落后了至少一个时代。在这期 Lex Fridman 的长谈中,黄仁勋用近乎残酷的坦诚,讲清了 NVIDIA 为何押上整个组织,从芯片公司进化为“AI 工厂设计商”,以及这场转型对所有 AI 从业者意味着什么。
如果你还把AI写代码当成“高级自动补全”,那你已经落后了一整年。Claude Code刚满一岁,却已经做到年化25亿美元收入、重塑Anthropic命运,甚至引发资本市场恐慌。这不是工具进化,而是软件工程的一次相变。
如果你以为 AI 的指数增长已经开始放缓,Dario Amodei 可能会同意你一半,但反对你另一半。在这场对话中,他一边承认我们正逼近某些极限,一边又抛出一个更危险的判断:真正决定胜负的,不再是算力,而是验证、强化学习,以及谁能活到下一轮。
如果我告诉你,只靠几个奇怪的提示词和API调用,就能“反向工程”出GPT-4在不同阶段吃过什么数据,你会不会觉得有点越界?在这期 Latent Space Lightning Pod 里,Datology 创始成员 Pratyush Maini 用一系列看似玩笑的实验,揭开了大模型训练数据、预训练阶段,甚至安全机制的真实边界。
如果你以为AI的瓶颈是电力、是算力价格、甚至是模型算法,那这场访谈会让你重新校准认知。Dylan Patel在一次看似闲聊的长访谈中,抛出了几个足以颠覆行业直觉的判断:GPU天生就会大量失败、能源根本不是核心约束,甚至——未来1%的数据中心可能在太空。
当所有大模型厂商都在拼命讲故事、晒自家指标时,有一家公司选择站在牌桌外,只做一件事:独立跑评测。Artificial Analysis 的创始人坦言:你不能花钱买更好的结果。正是这句看似“反商业”的坚持,让它成了今天 AI 行业最有影响力的第三方裁判。
本文深度解析Adam Marblestone在Dwarkesh Patel访谈中的核心观点,探讨大脑与人工智能在学习机制、奖励函数、推理能力及对齐问题上的根本区别。通过神经科学与机器学习的对比,揭示AI发展面临的关键挑战与未来方向,为读者提供理解智能本质的新视角。
本文带你走进Manus首席科学家季超的创业与技术历程,揭示AI行业的独特洞见、关键转折与真实故事。通过他的亲身经历,理解AI技术演进、团队选择与“身心健康”在创业中的新价值。