文章

从数学到RAG:Google研究员Kelvin Guu的模型方法论

从数学到RAG:Google研究员Kelvin Guu的模型方法论

在这期 No Priors 播客中,Google Brain 研究科学家 Kelvin Guu 回顾了自己从数学、统计走向自然语言处理的路径,并系统讲述了他在检索增强生成(RAG)、模块化模型和指令跟随方面的核心思考。这是一场关于“如何让模型更像工具而非黑箱”的深度对话。

api_bot · 2023-05-04 · 10 阅读 · AI/人工智能
AI画图终于会拼写了:DeepFloyd IF 给 Midjourney 上了一课

AI画图终于会拼写了:DeepFloyd IF 给 Midjourney 上了一课

过去一年,AI 画图最大的笑话不是手画不好,而是字写不对。现在,这个“行业通病”第一次被正面击穿。Stability AI 体系下的开源模型 DeepFloyd IF,开始在图片里稳定生成可读文字——这件事的意义,远不只是“能写对单词”这么简单。

api_bot · 2023-05-01 · 16 阅读 · AI/人工智能
AutoGPT 爆红三周后,行业集体冷静:它可能“太自动化了”

AutoGPT 爆红三周后,行业集体冷静:它可能“太自动化了”

三周前,AutoGPT 和 BabyAGI 被吹成“改变一切的 AI 助手”;三周后,最早冲上去试用的人开始集体泼冷水:它们很酷,但几乎没法用。这不是技术失败,而是一次关于“AI Agent 应该做什么”的认知纠偏。

api_bot · 2023-04-22 · 14 阅读 · AI/人工智能
一张照片就能写代码和配方,MiniGPT-4把“看懂世界”这件事提前了

一张照片就能写代码和配方,MiniGPT-4把“看懂世界”这件事提前了

当大家还沉浸在“AI会画画”的震撼中,一个更危险的能力正在浮出水面:AI开始真正“看懂”图片,并且能和你聊它。MiniGPT-4,这个刚亮相的开源研究项目,用一组演示把多模态AI从概念,直接拉进了可实操阶段。

api_bot · 2023-04-19 · 16 阅读 · AI/人工智能
为什么真正可用的AI Agent,核心问题不是能力而是信任

为什么真正可用的AI Agent,核心问题不是能力而是信任

Imbue(原 Generally Intelligent)两位创始人在 South Park Commons 的分享,罕见地把焦点从模型能力拉回到“信任”。他们解释了为何能替你行动的 AI Agent 必须首先是可理解、可检查、可解释的系统,以及他们为何用 Avalon 这样的模拟环境,重新定义通用智能研究的路径。

api_bot · 2023-02-22 · 12 阅读 · AI/人工智能
Hinge设计负责人在Config抛出的反直觉结论:好产品不是让人选择,而是逼人表达

Hinge设计负责人在Config抛出的反直觉结论:好产品不是让人选择,而是逼人表达

大多数人以为,现代约会App的核心是“匹配算法”和“无限滑动”。但Hinge设计负责人Lindsay Norman在Config 2022直接否定了这一点:真正决定成败的,是你如何逼用户把“真实的自己”说出来。这场演讲,对所有做AI产品、提示工程的人,都是一记重锤。

api_bot · 2022-05-19 · 8 阅读 · AI/人工智能
一个Figma插件演讲,提前预演了“AI替你做设计”的未来

一个Figma插件演讲,提前预演了“AI替你做设计”的未来

很多人以为“用自然语言生成设计”是这两年的新鲜事,但在2021年,Jordan Singer已经在Figma里把这件事跑通了。这场看似讲插件的分享,其实完整展示了:设计×代码×AI,是如何一步步把设计工具变成“可对话的创造机器”。

api_bot · 2021-05-24 · 17 阅读 · AI/人工智能