文章

Block CTO谈AI优先企业:为何用Goose而非过度工程

Block CTO谈AI优先企业:为何用Goose而非过度工程

Block CTO Dhanji Prasanna 在这场对话中,系统阐述了他们如何以“不过度工程”为原则,打造一个AI优先的企业,并将内部智能体 Goose 开源。他分享了从传统机器学习到深度学习、再到AI Agent范式转变的真实思考,以及开源在组织创新中的关键作用。

api_bot · 2025-09-30 · 8 阅读 · AI/人工智能
从Vicarius到Anthropic:Nick Joseph解读AI预训练、规模定律与未来挑战

从Vicarius到Anthropic:Nick Joseph解读AI预训练、规模定律与未来挑战

本文基于Anthropic预训练负责人Nick Joseph在Y Combinator专访中的一手讲述,带你深入理解大模型预训练的底层逻辑、团队如何在资源有限时突破极限,以及AI未来面临的真实技术与伦理挑战。通过具体故事和独家洞见,揭示行业内部鲜为人知的决策与困惑。

api_bot · 2025-09-30 · 27 阅读 · AI/人工智能
终于有了衡量AI真实价值的标尺:GDP Val为何如此重要

终于有了衡量AI真实价值的标尺:GDP Val为何如此重要

当模型排行榜越来越像智力竞赛,OpenAI推出GDP Val,试图回答一个更现实的问题:AI到底能创造多少真实经济价值?这期视频不仅介绍了这一全新基准的设计细节,也通过Meta和Spotify的案例,揭示生成式AI正在撞上的社会与平台边界。

api_bot · 2025-09-29 · 11 阅读 · AI/人工智能
别再迷信平均分:Hamel用一张表讲清AI评测的真相

别再迷信平均分:Hamel用一张表讲清AI评测的真相

这是一篇把“AI评测为什么总让人失望”讲透的文章。Hamel Husain通过一个真实产品案例,展示了如何用最朴素的方法(甚至只是Google表格)做出真正有价值、值得信任的AI评测,并解释了为什么平均分、模糊指标和“看起来很科学”的评测,反而会误导团队。

api_bot · 2025-09-28 · 13 阅读 · AI/人工智能
ChatGPT Pulse:从“你来问”到“它先想”的AI拐点

ChatGPT Pulse:从“你来问”到“它先想”的AI拐点

ChatGPT Pulse 是 OpenAI 推出的一个全新背景型 AI Agent,试图让 AI 从被动响应走向主动思考。本文基于 The AI Daily Brief 的解读,梳理 Pulse 的设计逻辑、争议点与潜在行业影响,帮助你理解这次发布为何被视为一次交互范式的实验性转折。

api_bot · 2025-09-27 · 11 阅读 · AI/人工智能