不是模型不行,是你把 AI 聊天做错了:一场关于 UX 的反击
几乎所有 AI 从业者都在用同一种方式做聊天,但真正拖垮体验的,恰恰是这套“行业默认”。这场演讲抛出一个刺耳结论:AI UX 崩坏,责任不在模型,而在你用错了连接方式。
几乎所有 AI 从业者都在用同一种方式做聊天,但真正拖垮体验的,恰恰是这套“行业默认”。这场演讲抛出一个刺耳结论:AI UX 崩坏,责任不在模型,而在你用错了连接方式。
GitHub 正在迎来史上最疯狂的代码增长期:一年 140 亿次提交,其中大量由 AI 共同完成。但更大的问题来了——代码更多,开发者真的更高效了吗?微软开发者布道师 Marlene Mhangami 用一场 Playwright 实战演示,给了一个让很多人不太舒服、却极其重要的答案。
当所有人都在争论MCP是不是AI Agent的“终极接口”时,Supabase的一次内部实验给出了一个让人不安的结论:只给工具,不给“正确用法”,最强模型也会把你的产品用错。这场分享讲的不是概念,而是为什么“Skill+MCP”才是当下最现实的解法。
Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。
OpenAI 悄悄把一件危险又迷人的东西塞进了手机:你可以用 ChatGPT App 远程控制 Codex 写代码、部署应用,甚至“YOLO 式”放手让它干活。这不是玩具,而是一次对开发者工作方式的正面冲击。
Laurie Voss 在这场演讲里抛出一个让很多工程师不舒服的事实:真正决定 AI Agent 能不能上线的,从来不是模型有多强,而是你有没有一套“能发现失败”的评估体系。这不是学术 talk,而是一条从 demo 到 production 的血路。
如果说 DALL·E 只是“能画”,那 OpenAI 最新一代图像模型已经开始“能干活”了。在最新一期 OpenAI Podcast 中,研究员和产品负责人罕见地同时承认:这是一次范式跃迁,而不是常规升级。为什么他们敢用“文艺复兴”来形容?这期播客给出了非常具体的答案。
当整个行业都在嘲笑“Token maxing 是智商税”时,AI Daily Brief 却反手给了一个更激进的结论:真正危险的不是烧 Token,而是不敢烧。尤其在 AI Agent 和新一代模型部署时代,这种保守,正在悄悄拉开高手与普通团队的差距。
这场来自微软团队的演讲抛出一个扎心结论:AI Agent 失效的根本原因,往往不是模型能力,而是可观测性的巨大缺口。你以为 agent 在工作,其实它可能早已偏航、烧钱、甚至悄悄制造安全风险。
Riley Brown 在视频里抛出一个扎心判断:大多数人不是没用 AI Agent,而是用错了。OpenClaw、Manis、Perplexity Computer 各自看起来都很强,但真正拉开差距的,是你有没有搞清楚“代理到底在替谁工作、能走多远、会不会失控”。这篇文章把那套判断框架拆给你。