文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

不是模型不行，是你把 AI 聊天做错了：一场关于 UX 的反击

几乎所有 AI 从业者都在用同一种方式做聊天，但真正拖垮体验的，恰恰是这套“行业默认”。这场演讲抛出一个刺耳结论：AI UX 崩坏，责任不在模型，而在你用错了连接方式。

api_bot · 2026-05-17 · 25 阅读 · AI/人工智能

一年140亿次提交之后，AI正在悄悄“搞乱”你的代码库

GitHub 正在迎来史上最疯狂的代码增长期：一年 140 亿次提交，其中大量由 AI 共同完成。但更大的问题来了——代码更多，开发者真的更高效了吗？微软开发者布道师 Marlene Mhangami 用一场 Playwright 实战演示，给了一个让很多人不太舒服、却极其重要的答案。

api_bot · 2026-05-16 · 48 阅读 · AI/人工智能

AI应用 AI Agent 代码生成 AI工具 Claude

Claude有MCP也会翻车？Supabase工程师揭穿AI Agent最大的认知幻觉

当所有人都在争论MCP是不是AI Agent的“终极接口”时，Supabase的一次内部实验给出了一个让人不安的结论：只给工具，不给“正确用法”，最强模型也会把你的产品用错。这场分享讲的不是概念，而是为什么“Skill+MCP”才是当下最现实的解法。

api_bot · 2026-05-15 · 30 阅读 · AI/人工智能

AI Agent

Intercom 用 AI 把工程效率翻倍：不是 Copilot，而是把 AI 当同事

Intercom 的工程团队做了一件很反直觉的事：他们不再纠结“用哪个模型更强”，而是直接把 AI 当成一名高级工程师来管理。结果是，在不扩招的前提下，工程产出真的翻了一倍。这不是概念，而是已经跑在生产里的现实。

api_bot · 2026-05-15 · 58 阅读 · AI/人工智能

AI应用 AI Agent 代码生成模型部署 Claude

Codex Mobile 刚发布就炸了：手机成了 AI 编程的“遥控器”

OpenAI 悄悄把一件危险又迷人的东西塞进了手机：你可以用 ChatGPT App 远程控制 Codex 写代码、部署应用，甚至“YOLO 式”放手让它干活。这不是玩具，而是一次对开发者工作方式的正面冲击。

api_bot · 2026-05-15 · 50 阅读 · AI/人工智能

AI Agent Claude Code OpenAI ChatGPT

AI Agent最容易翻车的不是模型，而是你没做这套 Evals

Laurie Voss 在这场演讲里抛出一个让很多工程师不舒服的事实：真正决定 AI Agent 能不能上线的，从来不是模型有多强，而是你有没有一套“能发现失败”的评估体系。这不是学术 talk，而是一条从 demo 到 production 的血路。

api_bot · 2026-05-14 · 28 阅读 · AI/人工智能

AI Agent 大语言模型

OpenAI一句“文艺复兴”，让图像生成正式告别玩具时代

如果说 DALL·E 只是“能画”，那 OpenAI 最新一代图像模型已经开始“能干活”了。在最新一期 OpenAI Podcast 中，研究员和产品负责人罕见地同时承认：这是一次范式跃迁，而不是常规升级。为什么他们敢用“文艺复兴”来形容？这期播客给出了非常具体的答案。

api_bot · 2026-05-14 · 54 阅读 · AI/人工智能

AI应用模型训练 AI Agent 生成式AI 提示工程

为“烧 Token”正名：为什么省钱思维正在拖慢 AI 团队

当整个行业都在嘲笑“Token maxing 是智商税”时，AI Daily Brief 却反手给了一个更激进的结论：真正危险的不是烧 Token，而是不敢烧。尤其在 AI Agent 和新一代模型部署时代，这种保守，正在悄悄拉开高手与普通团队的差距。

api_bot · 2026-05-14 · 32 阅读 · AI/人工智能

AI Agent 模型部署 Anthropic Token

多数 AI Agent 不是不聪明，而是你根本“看不见”它在犯错

这场来自微软团队的演讲抛出一个扎心结论：AI Agent 失效的根本原因，往往不是模型能力，而是可观测性的巨大缺口。你以为 agent 在工作，其实它可能早已偏航、烧钱、甚至悄悄制造安全风险。

api_bot · 2026-05-14 · 19 阅读 · AI/人工智能

AI Agent

别再乱试 AI Agent 了：这6个维度决定你是在提效，还是在浪费时间

Riley Brown 在视频里抛出一个扎心判断：大多数人不是没用 AI Agent，而是用错了。OpenClaw、Manis、Perplexity Computer 各自看起来都很强，但真正拉开差距的，是你有没有搞清楚“代理到底在替谁工作、能走多远、会不会失控”。这篇文章把那套判断框架拆给你。

api_bot · 2026-05-14 · 34 阅读 · AI/人工智能

AI Agent Perplexity

共 1214 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

4 月，4 周前