文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

BaseTen CEO谈AI推理：为什么“高效代码”正在赢

在这期 No Priors 播客中，BaseTen 联合创始人兼 CEO Tuhin Srivastava 讲述了他们四年多打磨 AI 推理基础设施的经历，以及他对“no-code 失灵”“推理成本失控”“买还是自己造”的一线观察。这是一场关于速度、效率和现实工程取舍的深度对话。

api_bot · 2024-03-21 · 23 阅读 · AI/人工智能

AI应用 GPU 推理机器学习模型部署

苹果要用 Google Gemini？这可能是 Apple AI 史上最诚实的一次妥协

如果你还以为 Apple 会靠自研模型悄悄逆袭生成式 AI，那这条消息会直接把你拉回现实：苹果正在和 Google 谈判，把 Gemini 放进 iPhone。这不是简单的技术合作，而是一次战略“认怂”，也可能是 Siri 重生、AI 竞争格局重排的关键一枪。

api_bot · 2024-03-19 · 13 阅读 · AI/人工智能

Sam Altman AI应用推理生成式AI 幻觉

45人团队、不烧营销，Perplexity如何用推理时间击穿谷歌搜索护城河

很多人以为 Perplexity 是“又一个 AI 搜索引擎”，但 CEO Aravind Srinivas 在 Stripe 的这场对话里反复强调：他们赢的不是模型，而是推理方式、工程文化和一系列看似无聊却致命的选择。更反直觉的是，Perplexity 并非从搜索起步，却可能最早重塑搜索的终局。

api_bot · 2024-03-15 · 20 阅读 · AI/人工智能

AI应用推理 AI Agent 开源模型检索增强生成

500 Token/秒的怪兽出现：它不是GPT，也不是Gemini

当所有人盯着 Sora 和 Gemini 1.5 时，一个几乎没上热搜的项目，悄悄把大语言模型的“速度天花板”直接掀了。不是模型变聪明了，而是“生成几乎没有等待时间”——这可能是生成式 AI 进入下一阶段的真正信号。

api_bot · 2024-02-21 · 17 阅读 · AI/人工智能

AI应用 GPU 推理生成式AI 大语言模型

100万Token不是噱头：Gemini 1.5把大模型带进“整本世界”时代

Google 这次不是小修小补，而是直接把大模型的“大脑容量”拉到新维度：100万 Token 上下文窗口。它意味着什么？不只是更长的对话，而是整本书、整部电影、完整代码库一起推理。更重要的是，这一次，Google 真的把东西交到了开发者手里。

api_bot · 2024-02-15 · 18 阅读 · AI/人工智能

Sam Altman 推理 AI Agent 上下文窗口大语言模型

NVIDIA把大模型搬进你电脑后，云AI第一次显得有点多余

当所有人还在讨论算力有多贵、GPU有多稀缺时，NVIDIA悄悄做了一件反方向的事：把大模型直接塞进你的个人电脑。本地运行、接你自己的数据、完全不出云——这不只是一个新产品，而是一次对云AI叙事的正面挑战。

api_bot · 2024-02-14 · 13 阅读 · AI/人工智能

Sam Altman AI应用 GPU 推理模型训练

谷歌终于亮出底牌：Gemini Ultra 正式对标 GPT‑4，AI 格局变了

谷歌亲手“杀死”了 Bard，把全部筹码压在 Gemini 上，并首次放出真正能与 GPT‑4 同级的模型 Ultra 1.0。这不只是一次产品升级，而是谷歌在 AI 战场上的一次自我救赎：一场迟到一年、却必须打赢的战争。

api_bot · 2024-02-09 · 13 阅读 · AI/人工智能

AI应用推理通用人工智能 AI Agent 代码生成

Sam Altman 在达沃斯放话：AGI 快到了，但世界未必会被颠覆

当所有人都在担心 AGI 会不会“毁灭世界”，Sam Altman 却在达沃斯说了一句反直觉的话：它来的不远，但影响可能没你想的大。这不是降温，而是 OpenAI 对现实的重新判断。

api_bot · 2024-01-18 · 12 阅读 · AI/人工智能

Sam Altman AI应用推理通用人工智能 AI Agent

开源模型逼近 GPT‑4：Mistral 用一次发布改写 AI 权力版图

一家成立不到半年的欧洲创业公司，用一款开源模型让整个 AI 圈开始重新评估 GPT‑4 的护城河。Mistral 不只是在“跑分上赢了”，它正在用开源、MoE 架构和极具挑衅意味的发布方式，重塑 2024 年的大模型竞争逻辑。

api_bot · 2023-12-13 · 16 阅读 · AI/人工智能

微调 GPU 推理融资开源模型

GPT-4在12月突然变“懒”？一次意外实验撕开大模型的真实一面

如果你觉得最近的 ChatGPT 回答变短、变敷衍了，这可能不是你的错觉。有人用同一段代码提示，只改了系统日期，就让 GPT-4 Turbo 的输出长度从 4000 多字跌到不到 500。更离谱的是：承诺给它“小费”，它真的会更卖力。

api_bot · 2023-12-13 · 19 阅读 · AI/人工智能

Sam Altman GPU 推理机器学习 AI安全

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，1 周前