用“搜索”重写深度学习编译器:Luminal的反直觉选择
Joe Fioti在这场演讲中提出了一个反直觉但极具启发性的观点:深度学习并不复杂,复杂的是我们构建它的方式。Luminal选择从搜索出发重新设计深度学习编译器,试图用极致的简化换取更大的系统空间。
Joe Fioti在这场演讲中提出了一个反直觉但极具启发性的观点:深度学习并不复杂,复杂的是我们构建它的方式。Luminal选择从搜索出发重新设计深度学习编译器,试图用极致的简化换取更大的系统空间。
这期《AI Daily Brief》用几个看似分散的新闻,拼出了一幅清晰的行业图景:DeepSeek正在为AGI正面冲锋,OpenAI一边应对安全与合规争议,一边加速自研芯片,而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。
AlphaGo 之后,AGI 真的更近了吗?在这场对话中,AlphaGo 与 MuZero 的核心工程师 Ioannis Antonoglou 回顾了 DeepMind 从围棋出发的真实决策、技术不确定性与关键转折,并分享了他对强化学习、幻觉问题以及下一代 AI Agent 的判断。
在这期《The Lightcone》新年特辑中,Y Combinator合伙人抛出了对2025年的一组大胆预测:AI可能再夺诺奖、稳定币走向日常支付、宏观利率左右加密市场,以及“可视频对话”的真人感AI即将出现。这不是技术清单,而是一幅正在成形的未来图景。
Cohere联合创始人兼CEO Aidan Gomez,既是Transformer论文作者之一,也是少数亲历大模型从学术走向企业落地的人。本篇文章通过他的个人经历与创业思考,讲清楚一个核心问题:为什么真正决定大模型价值的,不只是模型本身。
2024年,两项诺贝尔奖意外同时指向AI。杰弗里·辛顿因神经网络基础获物理学奖,AlphaFold团队因蛋白质结构预测获化学奖。这不仅是对技术突破的肯定,也暴露出AI先驱对失控风险的深层焦虑。
Sam Altman在《The Intelligence Age》中描绘了一个由AI驱动的繁荣未来,并大胆预测“超级智能可能在几千天内到来”。这期视频不仅拆解了他的核心论点,也呈现了行业内对这次叙事转向的质疑、震惊与政治意味。
OpenAI 刚刚发布了 o1,一个会在回答前“思考 10–20 秒”的模型。它不追求秒回,而是用推理碾压复杂问题:数学、代码、科研、法律。更重要的是,这可能意味着大模型 scaling 的游戏规则,正在被彻底改写。
当所有人都在讨论模型规模时,Demis Hassabis却反复强调:真正缺的不是算力,而是“会规划、能行动、懂世界”的智能。这场对话里,他回顾了DeepMind最早没人信的年代,也罕见系统讲清了Gemini、AlphaFold和通用智能背后的同一条技术主线。
我们每天都在用的大模型,其实连创造它们的人都说不清“为什么会这样回答”。Anthropic 刚刚公布的一项研究,第一次在 Claude 3 Sonnet 里找到了数百万个可识别、可操纵的“概念特征”,这可能是理解、控制乃至治理 LLM 的真正起点。