Waymo 的 EMMA:自动驾驶如何从“能跑”走向“会思考”
这场来自 Waymo 的技术分享,讲述了自动驾驶从早期神经网络到基础模型时代的关键跃迁。核心不在于“再堆一点模型”,而是如何用多模态、可解释的方式,解决规模化中最棘手的长尾安全问题。
这场来自 Waymo 的技术分享,讲述了自动驾驶从早期神经网络到基础模型时代的关键跃迁。核心不在于“再堆一点模型”,而是如何用多模态、可解释的方式,解决规模化中最棘手的长尾安全问题。
本文基于Andrej Karpathy在Y Combinator的演讲,深入解析了软件从传统编程到神经网络、再到大语言模型(LLM)驱动的三次范式转变,结合他在Tesla和个人项目中的真实经历,揭示AI如何重塑开发者角色、软件生态与未来机会。
OpenAI第二届DevDay几乎不谈消费者产品,也没有GPT-5,却释放出一个更重要的信号:AI正在从“更聪明的聊天机器人”转向“真正能行动、能规划的智能体”。本文还原发布会核心内容,解析实时语音、视觉微调、蒸馏与o1模型背后的战略转向。
ChatGPT 上线了一个“没人被正式告知”的新模型。它更聪明了吗?也许。但更重要的是:OpenAI 正在改变模型发布的规则,而这件事让从业者、研究者和开发者同时感到兴奋又不安。
在这场演讲中,吴恩达系统性地阐述了为什么“Agentic Workflow(智能体工作流)”将成为下一阶段AI应用的核心。他通过真实实验、失败与惊喜并存的案例,说明迭代、反思和多智能体协作,正在比单次更强模型更重要。
一组疑似泄露的 Google Gemini 截图,暴露的可能不只是一个新模型,而是 Google 正在悄悄改变开发者战争的打法:多模态只是表面,真正的筹码是“谁的工具链能留下开发者”。这件事,值得每个 AI 从业者认真看完。
还没全面开放,ChatGPT Vision已经被玩出“作弊级”用法:看图写代码、白板秒变产品原型、复杂停车牌一句话搞定。这不是炫技,而是AI把“理解世界”的门槛直接打穿。
Databricks 13亿美元收购 MosaicML,只是一个开始。真正的变化是:企业不再迷信“最强大模型”,而是集体转向“可控、私有、可定制”的 AI 路线。这场并购潮,正在悄悄重塑 AI 的权力结构。
设计系统最大的敌人不是规范不够,而是人类自己。一次 Config 演讲里,一位产品设计师展示了一个反直觉的原型:用 TensorFlow 给 Figma 做“拼写检查”,自动揪出设计系统里的隐形错误。这不是概念,而是已经跑起来的插件。
Lex Fridman 通过 Pixel 6 的一次“AI 开箱”,讲清了智能手机竞争正在从参数堆叠,转向以 AI 芯片为核心的体系之争。这不仅是一次硬件评测,更是一份关于边缘 AI、异构计算与未来人机关系的思考。