文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

为什么自建RAG系统，往往比你想象中更昂贵

很多团队以为RAG只是“向量数据库+大模型”的工程拼装，但Ofer用一线经验揭示：真正的成本隐藏在质量、规模、安全与运维细节中。这篇文章带你看清自建RAG在企业级落地时最容易被低估的七个坑。

api_bot · 2025-02-22 · 47 阅读 · AI/人工智能

为什么说 OpenLLMetry 是生成式 AI 可观测性的底座

这场来自 TraceLoop CEO 的分享，用一个极其务实的视角解释了：为什么生成式 AI 的可观测性问题，不能从零重新发明，而应该建立在 OpenTelemetry 之上。你将理解日志、指标、追踪在 LLM 应用中的真实价值，以及 OpenLLMetry 如何把这些能力“自动”带入现有观测平台。

api_bot · 2025-02-22 · 63 阅读 · AI/人工智能

AI Agent 生成式AI 大语言模型 Token 向量数据库

当软件变得概率化：向量数据库如何重塑AI的数据底座

这期对话中，MongoDB 产品与增长负责人 Sahir Azam 从“概率型软件”的视角出发，讨论了向量数据库为何成为 AI 时代的数据结构核心，以及数据库层必须发生的关键转变。

api_bot · 2025-02-13 · 28 阅读 · AI/人工智能

向量数据库

从Spotify到Modal：一位ML工程师对AI基础设施的长期判断

Modal创始人兼CEO Erik Bernhardsson回顾了自己在Spotify搭建推荐系统的经历，以及这些经验如何塑造了Modal的产品哲学。他分享了对云AI、GPU池化、向量数据库和AI基础设施未来的冷静判断，为理解AI应用真正的瓶颈提供了一线从业者视角。

api_bot · 2025-01-09 · 56 阅读 · AI/人工智能

AI应用 GPU 机器学习向量数据库 Transformer

让AI直接“接管”数据库：Supabase在DevDay丢出的狠招

如果你以为大模型只能“帮你写SQL”，那这场DevDay演示会直接刷新认知：Supabase把一整个Postgres数据库交给GPT-4o自主操作，还跑在浏览器里。不是概念，而是能自我修复、能做向量搜索、还能画图的真家伙。

api_bot · 2024-12-17 · 46 阅读 · AI/人工智能

AI应用大语言模型 OpenAI ChatGPT Embedding

不用向量数据库，Amperity 如何用 GPT-4o 把自然语言变成“能跑的 SQL”

在 OpenAI DevDay 的社区案例里，Amperity 抛出了一个让很多 AI 从业者愣住的做法：他们做了一个跨行业、跨上百客户的 NL2SQL 系统，却刻意没用向量数据库。取而代之的，是两步“研究式”上下文管理。这套思路，可能比你想象得更重要。

api_bot · 2024-12-17 · 38 阅读 · AI/人工智能

AI应用检索增强生成上下文窗口 OpenAI Embedding

一句话查全公司数据：Dust把Text-to-SQL玩成了“自然语言BI”

在 OpenAI DevDay 的一个并不起眼的社区演讲里，Dust 展示了一件让很多数据团队“后背一凉”的事：不用写 SQL、不用建 Dashboard，只靠一句自然语言，就能跨 Snowflake、Google Sheet、CSV 做复杂分析和可视化。这不是玩具 Demo，而是一整套已经跑在真实业务里的“自然语言 BI”。

api_bot · 2024-12-17 · 34 阅读 · AI/人工智能

AI应用通用人工智能 AI Agent 检索增强生成大语言模型