从理论到创业:Voyage AI CEO谈RAG与向量检索的真实价值
这期 No Priors 对话中,Stanford 计算机科学助理教授、Voyage AI 联合创始人兼 CEO Tanguma 回顾了自己从理论研究到创业的关键转折,并系统阐述了他对检索增强生成(RAG)、向量数据库以及大语言模型未来形态的判断。
这期 No Priors 对话中,Stanford 计算机科学助理教授、Voyage AI 联合创始人兼 CEO Tanguma 回顾了自己从理论研究到创业的关键转折,并系统阐述了他对检索增强生成(RAG)、向量数据库以及大语言模型未来形态的判断。
我们每天都在用的大模型,其实连创造它们的人都说不清“为什么会这样回答”。Anthropic 刚刚公布的一项研究,第一次在 Claude 3 Sonnet 里找到了数百万个可识别、可操纵的“概念特征”,这可能是理解、控制乃至治理 LLM 的真正起点。
当所有公司都在高喊“我们接入了大模型”,Stripe却在一场看似低调的分享中,给出了完全不同的答案:真正决定AI能不能落地的,不是模型能力,而是你有没有把它驯化进金融级基础设施。这场分享,透露了Stripe内部如何用Transformer、RAG和安全机制,把AI变成“可用、敢用、长期用”的生产力。
OpenAI和Google刚刚掀完桌子,微软Build就紧随其后。但真正值得盯紧的,不是又多了多少Copilot功能,而是微软是否正在为“没有OpenAI的未来”提前铺路。这场大会,可能比你想的更危险,也更关键。
就在GPT-4o刷屏、Copilot PC登场的同一天,OpenAI却被一场“声音像不像斯嘉丽·约翰逊”的争议抢走了所有风头。这不是八卦,而是一次足以影响语音AI、创作者关系与行业信任的关键事件。
曾经的程序员圣地,正在把自己的“灵魂”交给 AI。Stack Overflow 与 OpenAI 的合作,看起来是双赢,但它背后隐藏的,是开发者社区的信任危机、内容所有权的撕裂,以及整个开放互联网正在被重塑的残酷现实。
OpenAI 用一次 30 分钟的发布会,把所有人拉进了“未来助理”的想象里;而 Google 紧接着用一整场 I/O 告诉世界:我不只要赢模型,我要赢入口。这不是一次简单的产品对比,而是两种 AI 路线的正面冲撞。
芯片还不够,美国正考虑把出口管制延伸到“最先进的AI模型”。依据不是国籍,而是训练算力。更棘手的是,开源模型正在逼近前沿能力,中东国家也被迫选边站——这场AI地缘博弈,已经进入新阶段。
如果你以为 WWDC 2024 的主角是 iOS 18 的新 UI,那你可能低估了这场发布会。苹果正接近与 OpenAI 达成合作,把 ChatGPT 级别的能力直接放进 iPhone;与此同时,Sam Altman 对 AI 伦理、回音室、AGI 的态度也比以往更直白。这不是几条新闻,而是一条正在收紧的主线。
当大多数AI写作工具还在疯狂“套壳GPT”时,这位开发者却反其道而行:刻意放慢生成速度,用多模型、多Agent流程,去讨好一个越来越难伺候的对象——Google。RankBoost.ai不是更快,而是更“像人”。