从Q*到Strawberry:OpenAI真正想解决的不是聊天,而是“会规划的AI”
OpenAI内部一个被反复否认、又反复被曝光的项目,终于有了新名字:Strawberry。它不是更聪明的聊天机器人,而是一次对“推理、规划、长期任务”的正面进攻。这篇文章带你梳理Q*的前世今生,以及它为什么可能是Agent时代真正的起点。
OpenAI内部一个被反复否认、又反复被曝光的项目,终于有了新名字:Strawberry。它不是更聪明的聊天机器人,而是一次对“推理、规划、长期任务”的正面进攻。这篇文章带你梳理Q*的前世今生,以及它为什么可能是Agent时代真正的起点。
OpenAI在一次内部全员会议上,首次公开了一套“AGI分级系统”。更炸的是:他们认为自己正站在从聊天机器人迈向“人类级推理”的门槛上。这不仅重塑了我们理解AGI进度的方式,也暴露了OpenAI对风险、权力与监管的真实判断。
如果你以为“AI 泡沫”指的是一堆 GenAI 初创公司会倒下,那你可能看错了方向。真正被质疑的,是 NVIDIA、微软、亚马逊们正在进行的一场史无前例的算力豪赌,以及资本市场是否高估了这场赌局的短期回报。
在 Figma Config 2024 上,两位创业者抛出了一个让人后背发凉的判断:AI 失败的根源,往往不是能力不够,而是“关系越界”。他们用做产品一整年的血泪经验,重新定义了人类与 AI 的关系边界。
外界还在热议“Apple Intelligence 会不会用上 Llama”,苹果却悄悄给了 Meta 一个否定答案。这不是一次简单的合作流产,而是暴露了苹果、Meta、Google 在 AI 时代完全不同的野心分工,以及一条正在成形的 AI 行业潜规则。
这期Sequoia的《Training Data》对话中,Factory创始人Matan Grinberg和Eno Reyes分享了他们为何避开基础模型竞赛、转而在应用层打造“可靠的自动化软件工程Droid”。从个人人生转折到SWE-bench实战成绩,这是一场关于务实AI、企业价值与长期主义的深度讨论。
Anthropic 发布 Claude 3.5 Sonnet,被实测在多项指标上超过 GPT-4o。但真正让从业者坐不住的,不只是性能,而是一个叫 Artifacts 的界面更新——它正在悄悄改变人们“使用 AI”的方式。
OpenAI 的年化收入在 6 个月内翻倍,冲到 34 亿美元,但更反直觉的是:钱几乎不是来自微软。与此同时,苹果“不给钱”的合作、微软暗中扶植“第二个 OpenAI”,以及算力瓶颈正在同时挤压这家明星公司的未来。
当所有人都在讨论模型规模时,Demis Hassabis却反复强调:真正缺的不是算力,而是“会规划、能行动、懂世界”的智能。这场对话里,他回顾了DeepMind最早没人信的年代,也罕见系统讲清了Gemini、AlphaFold和通用智能背后的同一条技术主线。
Elon Musk 的 xAI 刚刚完成了史上最大规模的 Series B,但钱并不是最值得讨论的部分。真正让整个 AI 圈警觉的,是他对“算力”的极端押注,以及这背后一场正在失控的超级计算机竞赛。