OpenAI DevDay 2024 没发布 GPT-5,却悄悄改写了开发者的未来
所有人都在等 GPT-5,OpenAI 却在 DevDay 2024 上选择了另一条路:不拼参数规模,而是把“推理、语音、成本和代理”真正交到开发者手里。这场看似克制的发布,实际上比任何一次模型升级都更激进。
所有人都在等 GPT-5,OpenAI 却在 DevDay 2024 上选择了另一条路:不拼参数规模,而是把“推理、语音、成本和代理”真正交到开发者手里。这场看似克制的发布,实际上比任何一次模型升级都更激进。
当 GPT-4o mini 把 32k 成本从 120 美元打到 0.6 美元,很多人以为 AI 规模化已经变成“选便宜模型”的问题。但 OpenAI 在 DevDay 现场泼了一盆冷水:真正决定你能不能活下来的,不是成本,而是你是否先把准确率做到“商业可接受”。这场演讲,几乎是在拆穿所有 AI 应用的幻想。
在 OpenAI DevDay 的社区案例里,Amperity 抛出了一个让很多 AI 从业者愣住的做法:他们做了一个跨行业、跨上百客户的 NL2SQL 系统,却刻意没用向量数据库。取而代之的,是两步“研究式”上下文管理。这套思路,可能比你想象得更重要。
很多人还在纠结提示词工程,但真正拉开AI应用差距的,其实是RAG。这门由 Mckay Wrigley 讲授的课程,用一个完整真实项目证明:不懂RAG,你的AI永远只是在“表演智能”。
在这期 No Priors 播客中,Pinecone 创始人兼 CEO Edo Liberty 回顾了向量数据库从“没人理解”到生成式 AI 核心基础设施的全过程,解释了 Embedding 与 RAG 架构的真实价值,并分享了 Pinecone 在产品形态、开源策略和未来方向上的关键判断。
当所有人盯着英伟达的GPU排队名单时,孙正义已经在筹划一场1000亿美元级别的AI芯片豪赌;与此同时,OpenAI的Sora被两位AI大佬当众“泼冷水”。这期《AI Daily Brief》把一个信号说得很清楚:AI的战争,正在从模型转向芯片、数据和世界模型的底层分歧。
在这期 No Priors 播客中,Notion CEO 伊万·赵系统阐述了 Notion 的长期愿景:用“软件积木”取代碎片化应用,让 AI 成为人人可用的认知与创造工具。他分享了 Notion AI、Q&A、日历背后的方法论,以及他对未来十年计算形态的关键判断。
在Sam Altman“被开又复职”风波后,很多人以为OpenAI会被企业客户抛弃。结果恰恰相反:OpenAI的年化收入已经冲到20亿美元,速度快到让亚马逊、谷歌、Meta当年的曲线都显得“保守”。更值得关注的是,这背后真正改变AI行业格局的,并不只是OpenAI一家。
如果你觉得最近的 ChatGPT 回答变短、变敷衍了,这可能不是你的错觉。有人用同一段代码提示,只改了系统日期,就让 GPT-4 Turbo 的输出长度从 4000 多字跌到不到 500。更离谱的是:承诺给它“小费”,它真的会更卖力。
当所有人都在追逐更大、更封闭的模型时,Mistral 联合创始人 Arthur Mensch 却反其道而行,公开模型权重、押注开源,并直言:只有拿到权重,才真正谈得上安全与可控。这场与 Stripe 创始人 John Collison 的炉边谈话,透露了欧洲 AI 的另一种未来。