Intercom 用 AI 把工程效率翻倍:不是 Copilot,而是把 AI 当同事
Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。
Intercom 的工程团队做了一件很反直觉的事:他们不再纠结“用哪个模型更强”,而是直接把 AI 当成一名高级工程师来管理。结果是,在不扩招的前提下,工程产出真的翻了一倍。这不是概念,而是已经跑在生产里的现实。
这期 TBPN 一上来就抛出猛料:Cerebras 的 IPO 不是“还不错”,而是“好得离谱”。更反直觉的是,市场追捧的理由并不在训练,而在推理。Semi-Analysis 的深度拆解、OpenAI 的态度变化,以及 VC 圈的公开内斗,把 AI 基础设施的真实博弈摊在了台面上。
当所有人都在盯着参数规模时,这场对话却反其道而行:LLM 的成败,早就被 batch size、注意力稀疏性、机架拓扑和 KV cache 这些“底层细节”锁死了。Reiner Pope 用一小时把训练与推理背后的数学账和硬件账,一次性摊在桌面上。
如果我告诉你,只靠几个奇怪的提示词和API调用,就能“反向工程”出GPT-4在不同阶段吃过什么数据,你会不会觉得有点越界?在这期 Latent Space Lightning Pod 里,Datology 创始成员 Pratyush Maini 用一系列看似玩笑的实验,揭开了大模型训练数据、预训练阶段,甚至安全机制的真实边界。
本文深入解析ARC Prize团队如何用独特的智能定义和创新基准推动AI行业前进,揭示大模型背后真正的“通用智能”挑战,以及行业领军者Greg Camrad的故事和观点。你将看到AI评测的变革、技术演进的关键转折,以及通用人工智能的现实距离。
Harvey 联合创始人兼总裁 Gabe Pereyra 在 No Priors 访谈中,系统讲述了 AI 如何从“律师 Copilot”进化为重塑法律组织的核心基础设施。这不仅是效率工具的故事,更是关于企业级治理、Agent 工作流和法律行业未来结构的深度思考。
这期TBPN在ChatGPT三周年的时间点,回顾了生成式AI如何从技术话题走进家庭餐桌,并延展到芯片战争、媒体冲突与模型训练瓶颈。它不只是庆生,更是一份关于AI叙事如何成型、又如何反噬的行业切片。
在长期质疑与低预期中,Google正式发布了Gemini 3。这次发布并未靠营销造势取胜,而是通过真实能力、编码表现和原生AI Agent工具,重新把讨论焦点拉回“模型是否真的变强了”。
这期TBPN从多个看似分散的新闻切入,串起一条清晰主线:生成式AI正从狂热走向冷静。无论是对LLM路线的质疑、资本对英伟达的态度变化,还是大厂与创业者的不同下注方式,都指向同一个问题——这轮AI浪潮,究竟如何才能走得更远。
一次与记者的非正式晚餐,罕见地展示了Sam Altman对GPT‑5发布失误、AI是否撞墙、OpenAI商业化乃至AGI前景的真实想法。这篇文章还原那场谈话中最有价值的判断、反转与玩笑,帮助你理解OpenAI当下的战略心态。