ChatGPT 会“插话”了,Midjourney 6.1 更像相机:多模态体验正在失控升级
过去几个月,AI 的进化不像升级,更像“换物种”。ChatGPT 终于上线被反复跳票的高级语音模式,第一次让人觉得:它不是在“回答”,而是在“对话”。与此同时,Midjourney 6.1 几乎抹平了 AI 图像与摄影之间的界线。这两件事放在一起看,释放出一个危险又兴奋的信号:多模态,已经进入真实可用阶段。
过去几个月,AI 的进化不像升级,更像“换物种”。ChatGPT 终于上线被反复跳票的高级语音模式,第一次让人觉得:它不是在“回答”,而是在“对话”。与此同时,Midjourney 6.1 几乎抹平了 AI 图像与摄影之间的界线。这两件事放在一起看,释放出一个危险又兴奋的信号:多模态,已经进入真实可用阶段。
Google DeepMind研究副总裁Oriol Vinyals在播客中,回顾了Gemini诞生背后的组织变革,也直面当前大模型的关键限制。他给出的不是营销式愿景,而是关于上下文、检索、强化学习与搜索未来的第一手判断。
前Shopify AI负责人、现OpenAI产品负责人Miqdad Jaffer,分享了他在真实商业场景中构建AI产品的方法论:接受不确定性、让用户始终掌控、从最小可用价值出发,而不是迷信宏大战略。
如果你只记住一个数字,那就是:85亿美元。最新爆料显示,OpenAI 今年的总成本可能高达 85 亿美元,而收入只有 35–45 亿。这不是情绪化的唱空,而是来自最懂 AI 财务内幕的媒体。《The Information》把一颗深水炸弹,扔进了整个 AI 产业。
ChatGPT 是人类历史上采用速度最快的工作型技术,但它同时也暴露出一个残酷现实:大多数人试过,却没留下来。前 a16z 合伙人 Benedict Evans 提出了一个让整个行业不太舒服的判断——LLM 看起来像产品,其实可能是个陷阱。
OpenAI在一次内部全员会议上,首次公开了一套“AGI分级系统”。更炸的是:他们认为自己正站在从聊天机器人迈向“人类级推理”的门槛上。这不仅重塑了我们理解AGI进度的方式,也暴露了OpenAI对风险、权力与监管的真实判断。
在 Config 2024 的舞台上,一位设计师坦白:自己早就忘了三角函数,是靠 ChatGPT 和 Figma API 把两个“看起来像魔法”的插件做出来的。这不是励志鸡汤,而是一种正在成型的新范式——设计师、AI 与代码,正在重新分工。
在 Figma Config 2024 的压轴演讲中,NYU 教授 Reginé Gilbert 抛出一个让全场安静的判断:AI 越强,设计师越容易失去创造力。这不是反 AI 的演讲,而是一份写给所有 AI 从业者、产品经理和设计师的“清醒指南”。
微软没买下 Inflection,亚马逊也没收购 Adept,但核心创始人、团队和技术却纷纷“进驻”大厂。表面看是合作,实际上却像一次精心设计的“隐形并购”。更关键的是:这套打法,正在把 FTC 直接拉进 AI 战场。
在生成式AI疯狂内卷的两年里,Figma Config舞台上却有人泼了一盆冷水:对话AI真正决定体验的,不是模型参数,而是“对话本身”。这场来自Replika团队的分享,给所有AI从业者上了一堂反直觉的必修课。