文章

他为什么说ChatGPT设计得很糟,并亲手“修好”了它

他为什么说ChatGPT设计得很糟,并亲手“修好”了它

这支演讲并不是吐槽ChatGPT功能不够强,而是直指一个更少被讨论的问题:设计。演讲者通过真实演示,指出ChatGPT在语音与文本、多模型协作上的割裂体验,并展示如何用现成API重构一个“更像人类交流”的AI界面。

api_bot · 2025-06-03 · 21 阅读 · AI/人工智能
两周分析一万通销售电话:一个AI工程师的真实方法论

两周分析一万通销售电话:一个AI工程师的真实方法论

一次看似不可能的任务:两周内分析一万通销售电话。Charlie Guo 通过大语言模型、工程化系统设计和成本控制,把原本需要两年的人力工作,变成单人可完成的AI项目。这篇文章还原了其中最关键的技术决策、踩过的坑,以及对企业数据价值的深刻启示。

api_bot · 2025-06-03 · 18 阅读 · AI/人工智能
为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

为什么真正的AI Agent离不开“规划”,而不只是更长的提示词

从Instruct GPT到GPT‑4.1,语言模型在“听话”这件事上并没有线性进步。AI21 Labs 的 Yuval Belfer 通过工程视角给出答案:问题不在模型,而在我们把所有复杂性都塞进了一个提示词。真正可靠的 AI Agent,需要规划与执行引擎。

api_bot · 2025-06-03 · 21 阅读 · AI/人工智能
当大模型接管工具栏:Blender MCP 正在重塑创作方式

当大模型接管工具栏:Blender MCP 正在重塑创作方式

Blender MCP 并不是又一个“AI 自动建模”工具,而是一次对创作工具范式的重构。通过 MCP 协议,LLM 开始直接操控 Blender 这样的复杂软件,把“学习工具”这一步彻底隐藏在背后。本文还原了作者的真实动机、踩过的坑,以及他对未来创作工具的判断。

api_bot · 2025-06-03 · 19 阅读 · AI/人工智能
当机器人“抢工作”:Twilio文档团队的真实AI协作实践

当机器人“抢工作”:Twilio文档团队的真实AI协作实践

在这场来自 AI Engineer 世界博览会的演讲中,Elmer Thomas 和 Maria Bermudez 用一个真实而克制的案例,展示了AI如何不是取代人,而是成为小团队的放大器。他们分享了Twilio文档团队如何用多个单一职责AI Agent,解决高风险、低创造性的工作,并通过严密的护栏机制,把“AI会胡说八道”的风险降到可控范围。

api_bot · 2025-06-03 · 17 阅读 · AI/人工智能
Knowledge Graph Mullet:用混合图思维修剪GraphRAG复杂度

Knowledge Graph Mullet:用混合图思维修剪GraphRAG复杂度

这场演讲中,William Lyon提出了一个颇具画面感的概念——“Knowledge Graph Mullet”,用混合知识图谱的方式,解决GraphRAG在真实应用中过于复杂的问题。通过结合RDF与属性图、Dgraph与DQL,以及具体的新闻数据与AI Agent示例,他展示了一条更可落地的知识图谱+生成式AI路径。

api_bot · 2025-06-03 · 12 阅读 · AI/人工智能
别被“聪明感”骗了:LLM为何让人着迷却不在思考

别被“聪明感”骗了:LLM为何让人着迷却不在思考

这篇文章还原了Travis Frisinger关于“连贯性陷阱”的核心观点:大语言模型之所以让人感觉聪明,并非因为它们在思考,而是因为它们在高维空间中制造了强烈的连贯感。通过个人实验、工具构建和理论反思,演讲者给出了一个极具启发性的设计方向:停止追逐智能,转而设计结构化共振。

api_bot · 2025-06-03 · 18 阅读 · AI/人工智能
为什么90%的GenAI项目卡在规模化?AWS架构师的7个评估习惯

为什么90%的GenAI项目卡在规模化?AWS架构师的7个评估习惯

AWS首席应用AI架构师Justin Mohler基于多年一线经验指出:生成式AI无法规模化,最大瓶颈不是模型,而是评估体系。本文通过真实失败与逆袭案例,系统拆解他提出的“高效GenAI评估七大习惯”,解释为什么评估不是打分工具,而是发现问题、驱动成功的核心引擎。

api_bot · 2025-06-03 · 17 阅读 · AI/人工智能