20分钟内两次投弹:Opus 4.6 对撞 GPT‑5.3 Codex,实验室真的开战了
几乎同一时间,两家顶级实验室把最新前沿模型推上台面。不是发布会的喧闹,而是模型能力本身在“贴脸对打”:推理强度可控、Agent 团队、长上下文、代码一次就跑通——这次竞争,开始变得不体面也不留情。
几乎同一时间,两家顶级实验室把最新前沿模型推上台面。不是发布会的喧闹,而是模型能力本身在“贴脸对打”:推理强度可控、Agent 团队、长上下文、代码一次就跑通——这次竞争,开始变得不体面也不留情。
当所有人都在为电力、数据中心和芯片发愁时,马斯克抛出一个反直觉判断:36个月内,部署AI最便宜的地方将是太空。这不是科幻,而是一套从物理极限、能源约束到AI推理形态的完整逻辑。听完这场超长对话,你会重新理解AI的终局战场。
GPT‑5.2 开始解数学难题,但真正震撼科学界的不是模型本身,而是 OpenAI 做了一件更“脏活累活”的事:把 AI 直接嵌进科学家的日常工作流。Prism 的出现,可能比一次模型升级更接近“科学加速器”的本质。
OpenAI 首次 Town Hall 没有发布新模型,却信息量爆炸:Sam Altman 当众承认 GPT-5 写作“搞砸了”,明确招聘将放缓,同时抛出一个更激进的判断——两年内,更高水平的智能会以 100 倍更低成本到来。这场看似平淡的 Q&A,其实暴露了 OpenAI 的真实焦虑与路线选择。
如果你以为AGI只差算力和数据,那这期播客会让你清醒。前OpenAI研究副总裁Jerry Twerk首次系统谈及离职原因、他眼中真实的AGI时间表,以及一个让很多从业者不安的判断:强化学习和Scaling Laws,正在逼近天花板。
如果你还以为AGI只是个营销词,那这期对谈会让你不安。Yi Tay 亲口承认:把“AGI”写进团队名字并不是玩笑;而在IMO金牌、On-Policy RL、AI编程全面可用的背后,一条新的技术主线已经浮出水面。
如果你还把扩散模型当成“画图工具”,那你已经落后一个时代了。YC 这期 Decoded 里,Stanford 博士、前创业者 Francois Shaard 直接把话挑明:扩散不是生成图片的技巧,而是一种正在逼近通用智能的学习范式。这篇文章带你拆开它的底层逻辑、工程拐点和对创业者真正重要的信号。
当所有大模型厂商都在拼命讲故事、晒自家指标时,有一家公司选择站在牌桌外,只做一件事:独立跑评测。Artificial Analysis 的创始人坦言:你不能花钱买更好的结果。正是这句看似“反商业”的坚持,让它成了今天 AI 行业最有影响力的第三方裁判。
在这期《No Priors》对谈中,NVIDIA CEO 黄仁勋系统阐述了他对推理模型、AI就业、开源生态与地缘政治的判断。他反复强调:AI不是一次技术周期,而是一种正在成型的基础设施,并由此重塑产业、能源与全球合作方式。
这期对话围绕“通用机器人”展开,Physical Intelligence 的 Karol Hausman 与 Tobi Springenberg 分享了他们对机器人基础模型、智能层瓶颈以及强化学习角色的判断。文章提炼访谈中的关键洞见,解释为什么他们认为机器人距离大规模部署已不再遥远。