从RAG到推理模型:一位研究者眼中的下一代AI路径
这是一篇基于RedpointAI访谈的视频深度文章,核心围绕RAG的起源、企业级AI为何“完全不同”、以及推理与后训练的新方向。文章保留了研究者的真实判断与转折思考,帮助读者理解当下AI技术分化的关键脉络。
这是一篇基于RedpointAI访谈的视频深度文章,核心围绕RAG的起源、企业级AI为何“完全不同”、以及推理与后训练的新方向。文章保留了研究者的真实判断与转折思考,帮助读者理解当下AI技术分化的关键脉络。
这是一家仅成立一年的欧洲AI创业公司,却频繁被拿来与OpenAI对标。通过与Mistral AI CEO Arthur Mensch的深度对话,这期播客揭示了Mistral在开源、效率、分发与监管上的一整套反直觉选择,以及这些选择背后的技术与商业逻辑。
在这期 No Priors 播客中,Sourcegraph 联合创始人兼 CTO Beyang Liu 回顾了公司从代码搜索到 AI 编程助手 Cody 的演进,并分享了他对“上下文”“代码理解”和 AI 编程未来的关键判断。这不是一场关于模型参数的对话,而是一次关于开发者真实工作流的深度反思。
一个开源模型,参数1800亿,训练算力是LLaMA 2的4倍,实测性能击败GPT-3.5——而这还只是开始。Falcon 180B的发布,不只是技术里程碑,更把“强大AI该不该开源”的争论推到了必须表态的临界点。
Transformer共同作者Jakob Uszkoreit在播客中回顾了AI架构的关键转折,并解释他为何离开Google创办Inceptive,试图把深度学习的方法论引入RNA药物研发,重新思考“软件”与“生命”的边界。
很多人第一次用 ChatGPT 时都有一种错觉:语言智能的问题,好像已经被解决了。但一篇由剑桥、UCL、Meta AI 等机构联合完成的论文却泼了一盆冷水——我们可能才刚刚站在起点。真正的挑战,不是“模型不够大”,而是一整套尚未被驯服的复杂系统问题。
ChatGPT 最近加了一个看似不起眼的功能,却悄悄改变了它的使用方式。它不是插件,不是代码解释器,而是一个“永久生效”的提示层。已经有人用它造助理、改人格,甚至逼近 AutoGPT。这一次,真正拉开差距的不是模型能力,而是你会不会用。
如果我告诉你:AI已经能在你什么都不说的情况下,把你“看到的画面”复原成视频,你会觉得这是噱头还是失控的前夜?这项名为 Mind Video 的研究,正在把“读心术”从科幻拖进现实,而且速度比大多数人想象得更快。
过去一年,AI 画图最大的笑话不是手画不好,而是字写不对。现在,这个“行业通病”第一次被正面击穿。Stability AI 体系下的开源模型 DeepFloyd IF,开始在图片里稳定生成可读文字——这件事的意义,远不只是“能写对单词”这么简单。
如果你以为 ChatGPT 是某种“不可复现的黑魔法”,那 Andrej Karpathy 这场公开视频,可能会让你非常不安——因为他几乎是用最朴素的方式,把 GPT 从零写了出来。从字符级建模到 Transformer 内核,这不是科普,而是一次赤裸裸的技术摊牌。