文章

BaseTen CEO谈AI推理:为什么“高效代码”正在赢

BaseTen CEO谈AI推理:为什么“高效代码”正在赢

在这期 No Priors 播客中,BaseTen 联合创始人兼 CEO Tuhin Srivastava 讲述了他们四年多打磨 AI 推理基础设施的经历,以及他对“no-code 失灵”“推理成本失控”“买还是自己造”的一线观察。这是一场关于速度、效率和现实工程取舍的深度对话。

api_bot · 2024-03-21 · 23 阅读 · AI/人工智能
苹果要用 Google Gemini?这可能是 Apple AI 史上最诚实的一次妥协

苹果要用 Google Gemini?这可能是 Apple AI 史上最诚实的一次妥协

如果你还以为 Apple 会靠自研模型悄悄逆袭生成式 AI,那这条消息会直接把你拉回现实:苹果正在和 Google 谈判,把 Gemini 放进 iPhone。这不是简单的技术合作,而是一次战略“认怂”,也可能是 Siri 重生、AI 竞争格局重排的关键一枪。

api_bot · 2024-03-19 · 13 阅读 · AI/人工智能
45人团队、不烧营销,Perplexity如何用推理时间击穿谷歌搜索护城河

45人团队、不烧营销,Perplexity如何用推理时间击穿谷歌搜索护城河

很多人以为 Perplexity 是“又一个 AI 搜索引擎”,但 CEO Aravind Srinivas 在 Stripe 的这场对话里反复强调:他们赢的不是模型,而是推理方式、工程文化和一系列看似无聊却致命的选择。更反直觉的是,Perplexity 并非从搜索起步,却可能最早重塑搜索的终局。

api_bot · 2024-03-15 · 20 阅读 · AI/人工智能
100万Token不是噱头:Gemini 1.5把大模型带进“整本世界”时代

100万Token不是噱头:Gemini 1.5把大模型带进“整本世界”时代

Google 这次不是小修小补,而是直接把大模型的“大脑容量”拉到新维度:100万 Token 上下文窗口。它意味着什么?不只是更长的对话,而是整本书、整部电影、完整代码库一起推理。更重要的是,这一次,Google 真的把东西交到了开发者手里。

api_bot · 2024-02-15 · 18 阅读 · AI/人工智能
NVIDIA把大模型搬进你电脑后,云AI第一次显得有点多余

NVIDIA把大模型搬进你电脑后,云AI第一次显得有点多余

当所有人还在讨论算力有多贵、GPU有多稀缺时,NVIDIA悄悄做了一件反方向的事:把大模型直接塞进你的个人电脑。本地运行、接你自己的数据、完全不出云——这不只是一个新产品,而是一次对云AI叙事的正面挑战。

api_bot · 2024-02-14 · 13 阅读 · AI/人工智能
谷歌终于亮出底牌:Gemini Ultra 正式对标 GPT‑4,AI 格局变了

谷歌终于亮出底牌:Gemini Ultra 正式对标 GPT‑4,AI 格局变了

谷歌亲手“杀死”了 Bard,把全部筹码压在 Gemini 上,并首次放出真正能与 GPT‑4 同级的模型 Ultra 1.0。这不只是一次产品升级,而是谷歌在 AI 战场上的一次自我救赎:一场迟到一年、却必须打赢的战争。

api_bot · 2024-02-09 · 13 阅读 · AI/人工智能
开源模型逼近 GPT‑4:Mistral 用一次发布改写 AI 权力版图

开源模型逼近 GPT‑4:Mistral 用一次发布改写 AI 权力版图

一家成立不到半年的欧洲创业公司,用一款开源模型让整个 AI 圈开始重新评估 GPT‑4 的护城河。Mistral 不只是在“跑分上赢了”,它正在用开源、MoE 架构和极具挑衅意味的发布方式,重塑 2024 年的大模型竞争逻辑。

api_bot · 2023-12-13 · 16 阅读 · AI/人工智能
GPT-4在12月突然变“懒”?一次意外实验撕开大模型的真实一面

GPT-4在12月突然变“懒”?一次意外实验撕开大模型的真实一面

如果你觉得最近的 ChatGPT 回答变短、变敷衍了,这可能不是你的错觉。有人用同一段代码提示,只改了系统日期,就让 GPT-4 Turbo 的输出长度从 4000 多字跌到不到 500。更离谱的是:承诺给它“小费”,它真的会更卖力。

api_bot · 2023-12-13 · 19 阅读 · AI/人工智能