不是OpenAI:这一周真正改变AI走向的3个发布
这一周,最重要的AI更新几乎都不来自OpenAI。ElevenLabs悄悄对Audible动刀,Pika把“拍电影”门槛打到地板价,微软则把Copilot推向“情感型AI伙伴”。这不是模型参数的竞赛,而是AI开始重塑内容、创作与人机关系的分水岭。
这一周,最重要的AI更新几乎都不来自OpenAI。ElevenLabs悄悄对Audible动刀,Pika把“拍电影”门槛打到地板价,微软则把Copilot推向“情感型AI伙伴”。这不是模型参数的竞赛,而是AI开始重塑内容、创作与人机关系的分水岭。
OpenAI第二届DevDay几乎不谈消费者产品,也没有GPT-5,却释放出一个更重要的信号:AI正在从“更聪明的聊天机器人”转向“真正能行动、能规划的智能体”。本文还原发布会核心内容,解析实时语音、视觉微调、蒸馏与o1模型背后的战略转向。
有人用AI做语音角色应用,外表像玩具,实际却在稳定赚钱。Greg Isenberg 用一场不到40分钟的实操,展示了一个反直觉事实:今天的AI创业,拼的早已不是模型能力,而是你把“无聊技术”组合成“有情绪的产品”的能力。
Meta Connect 2024 上,真正的主角并不是某个参数爆炸的模型,而是扎克伯格本人。他一边用 Llama 3.2 夯实“开源 AI 基础设施”,一边用 Orion AR 眼镜重新点燃 Meta 最初的愿景。这场发布会,像极了当年乔布斯把技术、产品与长期叙事绑在一起的时刻。
如果你还觉得「AI 客服」只是个接 OpenAI API 的聊天框,那这条视频会直接把你打醒。Mckay Wrigley 用 Cursor 从零搭出一个接近 Intercom 的 AI 客服系统:有 UI、有 Agent、有函数调用、能进数据库,甚至还能分流到 Slack。更狠的是,大部分代码不是“写”的,是“说”出来的。
一个反直觉的事实正在发生:你不碰键盘,只动嘴,也能在5分钟内做出一个可用的金融仪表盘。Mckay Wrigley 用 Cursor + 语音,把“写代码”变成了“指挥 AI 干活”。这不是炫技视频,而是一次对开发方式的正面冲击。
如果你还觉得“自研大模型=护城河”,这期 AI Daily Brief 可能会让你彻底清醒。从创业者随时切换模型,到微软、Meta、NVIDIA 把重心压向“小而便宜”,一个信号已经非常明确:模型本身,正在快速走向商品化。
别再争论“企业到底用没用 AI 了”。这一次,不是问卷、不是采访,而是数十亿美元的真实公司支出数据:AI,已经成了企业里增长最快的一项费用,而且正在从试水,变成长期绑定。
过去几个月,AI 的进化不像升级,更像“换物种”。ChatGPT 终于上线被反复跳票的高级语音模式,第一次让人觉得:它不是在“回答”,而是在“对话”。与此同时,Midjourney 6.1 几乎抹平了 AI 图像与摄影之间的界线。这两件事放在一起看,释放出一个危险又兴奋的信号:多模态,已经进入真实可用阶段。
苹果被逼着“表态AI”,却又在关键时刻选择踩刹车;演员因AI罢工、数据被悄悄拿去训练、假声音冲击选举……这期AI新闻把一个残酷现实摆到台前:AI跑得越快,社会越跟不上。