从 PyTorch 到 Fireworks:林乔如何用“小模型”重塑 AI 推理
正在加载视频...
视频章节
Fireworks 创始人兼 CEO 林乔,曾主导 Meta 内部 PyTorch 的核心工作。她在这次访谈中回顾了一个“以为只要 6 个月、结果做了 5 年”的工程教训,并由此提出一个极具冲击力的使命:把 AI 产品的落地周期,从 5 年压缩到 5 周,甚至 5 天。
从 PyTorch 到 Fireworks:林乔如何用“小模型”重塑 AI 推理
Fireworks 创始人兼 CEO 林乔,曾主导 Meta 内部 PyTorch 的核心工作。她在这次访谈中回顾了一个“以为只要 6 个月、结果做了 5 年”的工程教训,并由此提出一个极具冲击力的使命:把 AI 产品的落地周期,从 5 年压缩到 5 周,甚至 5 天。
一个被严重低估的工程现实:从 6 个月到 5 年
如果只看结果,今天的 PyTorch 像是一个理所当然的基础设施。但林乔回忆,事情一开始远没有那么简单。她和团队最初以为,把内部 AI 框架迁移到 PyTorch,“just swap the library”,顶多是个 6 个月的项目。然而现实是,他们最终花了整整 5 年。
问题不在于 API,而在于系统级复杂度。为了让 PyTorch 真正承载 Meta 全部 AI 工作负载,团队不得不“从地基开始重建整个技术栈”:数据如何高效加载、如何在 PyTorch 中做分布式推理、如何规模化训练。这不是修修补补,而是推倒重来。
结果是一个极端规模的系统——在她离开时,这套基于 PyTorch 的基础设施每天支撑着超过 5 万亿次推理请求。这个数字不是炫耀,而是一个反差:外界看到的是‘简单好用’,内部承受的是巨量复杂性。这个反差,成为她后来创业最重要的认知起点。
“简单性会规模化”:PyTorch 留下的第一性原则
为什么 PyTorch 能赢?林乔给出的答案并不是性能指标,而是一个看似朴素却极其难做到的词:简单。她直言,研究者之所以热爱 PyTorch,是因为“simplicity scales(简单性是可以规模化的)”。
这种简单并不是一开始就有,而是一场“relentless journey(毫不妥协的长期战斗)”。每一代设计、每一次接口调整,核心问题只有一个:能不能让用户体验再简单一点?哪怕背后需要引入更多工程复杂度,也要把它彻底吞掉。
这套方法论后来被她原封不动地带到了 Fireworks。正如主持人评价的那样,Fireworks 作为一家企业,“embraced an enormous amount of complexity to make life simple for your customers”。在林乔看来,这是基础设施公司唯一正确的姿态:复杂性必须存在,但它不该暴露给用户。
Fireworks 的使命:把 AI 上线周期从 5 年压到 5 天
Fireworks 成立于 2022 年,定位非常明确:一个面向生成式 AI 的推理与高质量微调 SaaS 平台。林乔强调,它首先解决的不是“能不能训练最大模型”,而是“能不能让 AI 真正进入业务”。
她提出了一个极具冲击力的目标:将整个行业的 time to market,从 5 年压缩到 5 周,甚至 5 天。这不是营销口号,而是直接源自她在 PyTorch 的亲身经历——当基础设施不成熟时,任何创新都会被拖慢。
Fireworks 的路径是“小模型栈”。通过更小、更可定制的模型,平台可以实现更低延迟、更低成本,并支持自动化的微调流程,帮助企业获得“tailored high quality”。这让生成式 AI 不再只是实验室里的 demo,而是可以被持续部署、持续迭代的生产系统。
推理、微调与算力现实:不回避 NVIDIA,也不被其定义
在访谈后半段,话题自然落到了推理市场的现实问题上,包括企业客户处在 AI 旅程的哪个阶段、以及有多少人在使用 Fireworks 做微调。林乔的判断是明确的:随着模型质量逐步收敛,差异将越来越多地出现在系统层与应用层。
当被问及是否存在 NVIDIA 的可行竞争者时,她并没有给出情绪化的答案,而是回到趋势本身——硬件可能收敛,但软件和系统设计的价值正在上升。这也是她持续强调“小模型”和“系统效率”的原因。
在她的愿景中,Fireworks 并不是一个封闭的平台,而是一个可以被开发者和企业“leverage and build on top of”的基础设施层。真正重要的,不是谁拥有最大模型,而是谁能让更多人、更多场景,用得起、用得好 AI。
总结
林乔的故事并不是一个“再造平台”的创业叙事,而是一条清晰的因果链:在 PyTorch 中亲历 5 年系统重建,才真正理解“简单”的代价;理解了这个代价,才会在 Fireworks 中主动拥抱复杂性。对读者而言,最大的启发或许在于:AI 的下一阶段竞争,不在参数规模,而在谁能把复杂世界,变成普通人可用的工具。
关键词: Fireworks, PyTorch, AI 推理, 小模型, 微调
事实核查备注: 林乔曾主导 Meta 内部 PyTorch 项目;PyTorch 基础设施曾支撑每天超过 5 万亿次推理;Fireworks 成立于 2022 年;Fireworks 定位为生成式 AI 推理与微调 SaaS 平台;访谈中提及 NVIDIA、Meta、PyTorch、小模型、推理与微调等概念