BaseTen CEO谈AI推理:为什么“高效代码”正在赢
在这期 No Priors 播客中,BaseTen 联合创始人兼 CEO Tuhin Srivastava 讲述了他们四年多打磨 AI 推理基础设施的经历,以及他对“no-code 失灵”“推理成本失控”“买还是自己造”的一线观察。这是一场关于速度、效率和现实工程取舍的深度对话。
在这期 No Priors 播客中,BaseTen 联合创始人兼 CEO Tuhin Srivastava 讲述了他们四年多打磨 AI 推理基础设施的经历,以及他对“no-code 失灵”“推理成本失控”“买还是自己造”的一线观察。这是一场关于速度、效率和现实工程取舍的深度对话。
如果你还以为 Apple 会靠自研模型悄悄逆袭生成式 AI,那这条消息会直接把你拉回现实:苹果正在和 Google 谈判,把 Gemini 放进 iPhone。这不是简单的技术合作,而是一次战略“认怂”,也可能是 Siri 重生、AI 竞争格局重排的关键一枪。
很多人以为 Perplexity 是“又一个 AI 搜索引擎”,但 CEO Aravind Srinivas 在 Stripe 的这场对话里反复强调:他们赢的不是模型,而是推理方式、工程文化和一系列看似无聊却致命的选择。更反直觉的是,Perplexity 并非从搜索起步,却可能最早重塑搜索的终局。
当所有人盯着 Sora 和 Gemini 1.5 时,一个几乎没上热搜的项目,悄悄把大语言模型的“速度天花板”直接掀了。不是模型变聪明了,而是“生成几乎没有等待时间”——这可能是生成式 AI 进入下一阶段的真正信号。
Google 这次不是小修小补,而是直接把大模型的“大脑容量”拉到新维度:100万 Token 上下文窗口。它意味着什么?不只是更长的对话,而是整本书、整部电影、完整代码库一起推理。更重要的是,这一次,Google 真的把东西交到了开发者手里。
当所有人还在讨论算力有多贵、GPU有多稀缺时,NVIDIA悄悄做了一件反方向的事:把大模型直接塞进你的个人电脑。本地运行、接你自己的数据、完全不出云——这不只是一个新产品,而是一次对云AI叙事的正面挑战。
谷歌亲手“杀死”了 Bard,把全部筹码压在 Gemini 上,并首次放出真正能与 GPT‑4 同级的模型 Ultra 1.0。这不只是一次产品升级,而是谷歌在 AI 战场上的一次自我救赎:一场迟到一年、却必须打赢的战争。
当所有人都在担心 AGI 会不会“毁灭世界”,Sam Altman 却在达沃斯说了一句反直觉的话:它来的不远,但影响可能没你想的大。这不是降温,而是 OpenAI 对现实的重新判断。
一家成立不到半年的欧洲创业公司,用一款开源模型让整个 AI 圈开始重新评估 GPT‑4 的护城河。Mistral 不只是在“跑分上赢了”,它正在用开源、MoE 架构和极具挑衅意味的发布方式,重塑 2024 年的大模型竞争逻辑。
如果你觉得最近的 ChatGPT 回答变短、变敷衍了,这可能不是你的错觉。有人用同一段代码提示,只改了系统日期,就让 GPT-4 Turbo 的输出长度从 4000 多字跌到不到 500。更离谱的是:承诺给它“小费”,它真的会更卖力。