文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

他用AI让雕像“打电话说话”，却意外揭开语音Agent的真正未来

如果有一天，你在博物馆里拍下一尊雕像，30秒后它给你打来电话，这不是科幻，而是 ElevenLabs 的一次真实实验。Joe Reeve 用一个“和雕像聊天”的小应用，讲清了当下语音 AI、Agent 和多模态体验中最被低估、也最关键的变化。

api_bot · 2026-06-01 · 6 阅读 · AI/人工智能

AI应用 AI Agent 对话AI 多模态语音AI

OpenAI 把模型丢进赛道：7秒进站，0.1秒决胜的真实AI战场

很多人以为AI的价值在“更聪明”，但这支顶级赛车队证明：真正的胜负，藏在7秒的进站和0.1秒的决策里。OpenAI把模型从实验室推上赛道，第一次让AI直面时间、压力和不可逆的真实世界。

api_bot · 2026-05-28 · 17 阅读 · AI/人工智能

AI应用生成式AI 对话AI OpenAI ChatGPT

把前沿大模型搬回家：一位工程师对云AI的“反叛”

当所有人都在把最强的大模型推向云端，Alex Cheema 却在做一件反方向的事：让 Frontier AI 跑在你自己的硬件上。这场看似“逆潮流”的尝试，背后藏着对成本、控制权和 AI 未来形态的深刻判断。

api_bot · 2026-05-26 · 22 阅读 · AI/人工智能

推理模型部署对话AI 大语言模型 ChatGPT

从“产品大爆发”到“三场生死赛”，Peter Yang 点破 Google AI 真问题

Google I/O 刚结束，外界一片“AI 火力全开”的惊叹，但 Peter Yang 却给出了一个刺耳结论：产品太多，反而是战略问题。这不是一篇吹捧 Gemini 的文章，而是一份来自 AI 一线从业者的清醒诊断——以及 Google 真正不能输的三场 AI 战争。

api_bot · 2026-05-21 · 23 阅读 · AI/人工智能

AI应用 AI Agent 代码生成对话AI 多模态

Gemini Any-to-Any 曝光：多模态 Agent 真正的分水岭来了

Patrick Löber 在 Google DeepMind 的这场演讲，真正炸的不是“又一个多模态模型”，而是一句被很多人忽略的话：Any-to-Any 现在并不是一个模型，而是一种架构选择。这意味着，多模态 Agent 的玩法，已经彻底变了。

api_bot · 2026-05-20 · 28 阅读 · AI/人工智能

神经网络代码生成对话AI 多模态计算机视觉

Token 正在骗你：硅谷投资人重新计算 AI 的真实成本

所有人都在盯着 token 消耗，但真正决定 AI 生死的指标，可能恰恰不是 token。本期播客里，一位长期投资 OpenAI、Anthropic 的投资人，抛出了几个让硅谷都不安的判断：token 是幻觉，agent 才是引擎，而真正的稀缺品正在从算力转向人的连接。

api_bot · 2026-05-18 · 84 阅读 · AI/人工智能

AI应用推理模型训练 AI Agent 代码生成

他们用 AI 调试 AI，一年后发现比写模型本身还重要的东西

当所有人都在讨论如何“把 AI 做得更聪明”时，incident.io 的创始工程师却踩中了一个更残酷的现实：真正让 AI 产品崩溃的，从来不是模型能力，而是你根本不知道它为什么会这么回答。这场演讲讲的不是炫技，而是 AI 工程化里最容易被忽视、却最致命的一环。

api_bot · 2026-05-17 · 37 阅读 · AI/人工智能

AI应用 AI Agent 对话AI Anthropic 提示工程

不是模型不行，是你把 AI 聊天做错了：一场关于 UX 的反击

几乎所有 AI 从业者都在用同一种方式做聊天，但真正拖垮体验的，恰恰是这套“行业默认”。这场演讲抛出一个刺耳结论：AI UX 崩坏，责任不在模型，而在你用错了连接方式。

api_bot · 2026-05-17 · 23 阅读 · AI/人工智能

AI Agent 对话AI 大语言模型

这家AI每天“偷听”医生上亿次对话，却改变了医疗的决策方式

如果你以为医疗AI的核心是模型有多大，那这期播客会直接打脸。Abridge 团队讲了一个完全不同的故事：真正难的不是“听懂”，而是“什么时候该听、什么时候该闭嘴”。他们正在用对话AI重构临床决策的底层逻辑。

api_bot · 2026-05-14 · 39 阅读 · AI/人工智能

AI工具对话AI 无监督学习

TTS正在变成另一个LLM：Mistral科学家揭开语音模型的真相

文本转语音不再是“把字念出来”那么简单。Mistral 的 Samuel Humeau 直接抛出一个行业级判断：今天最强的 TTS，正在被重构成“像大语言模型一样”的系统，而且这一变化，正是实时语音 Agent 爆发的前提。

api_bot · 2026-05-09 · 51 阅读 · AI/人工智能

AI应用 GPU AI Agent 开源模型对话AI

共 410 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

4 月，3 周前