从Cursor到Llama：AI浪潮下的生产力、权力与失真

AI PM 编辑部 · 2025年04月10日 · 10 阅读 · AI/人工智能

Sam Altman Noam Shazeer Mustafa Suleyman 微调 AI工具模型训练多模态代码生成生成式AI AI应用

正在加载视频...

视频章节

这期《AI Daily Brief》串起了四个看似分散却高度相关的故事：Cursor的爆发式增长、OpenAI对新型AI硬件的野心、DeepMind用非竞业协议锁住人才，以及Meta陷入的基准测试争议。它们共同勾勒出当下AI产业的真实图景：自下而上的工具革命、人才争夺的白热化，以及对“指标”的集体焦虑。

从Cursor到Llama：AI浪潮下的生产力、权力与失真

这期《AI Daily Brief》串起了四个看似分散却高度相关的故事：Cursor的爆发式增长、OpenAI对新型AI硬件的野心、DeepMind用非竞业协议锁住人才，以及Meta陷入的基准测试争议。它们共同勾勒出当下AI产业的真实图景：自下而上的工具革命、人才争夺的白热化，以及对“指标”的集体焦虑。

Cursor的一百万用户：一场真正的自下而上革命

为什么Cursor的增长如此值得关注？因为它几乎违背了我们对SaaS成功路径的所有既有认知。三年历史、零市场投放，却成为“有史以来增长最快的初创公司之一”。主持人用一句话点破了关键：“Cursor hit a million users， honestly， without really trying.”

Cursor背后的公司Anyphere在今年1月披露，其年经常性收入（ARR）达到1亿美元，而彭博社的消息称，这一数字在3月已经翻倍。平台目前拥有约100万日活用户，却只有两个极其简单的定价方案：个人版每月20美元，商业版40美元。更耐人寻味的是，Anyphere总裁Oscar Scholes明确表示，Cursor的收入“几乎全部来自个人用户”，而这些人中有大量是在公司工作、却自掏腰包使用工具的程序员。

这揭示了一个重要趋势：AI编码工具的采用并非来自企业IT决策，而是来自一线开发者的真实需求。主持人形容这种情况是“bottom up adoption”，甚至补充说，很多人是在“自己的时间、自己的钱”上使用Cursor。这不是企业采购推动的效率工具，而是程序员主动选择的生产力放大器。

直到现在，Cursor才开始认真对待企业市场：在刻意模糊的企业引导流程下，已经有1.4万家公司注册；仅2月，就有超过4000家公司希望测试产品。Anyphere正在以约100亿美元估值洽谈融资，公司规模却只有约60人。这种“极小团队撬动极大价值”的故事，正是Vibe Coding走向主流的最好注脚。

没有屏幕的手机？OpenAI对AI硬件的早期下注

如果说Cursor代表了软件层面的生产力革命，那OpenAI的最新传闻则指向硬件与交互方式的重构。《The Information》报道称，OpenAI正在讨论收购一家具备“AI原生设备”概念的初创公司，其核心人物正是iPhone设计师Jony Ive，潜在收购价高达5亿美元。

目前披露的信息非常克制：团队只做了“初步设计”，还没有完整原型；设想中的产品包括“没有屏幕的手机”以及其他家庭场景设备。Sam Altman被描述为与该团队“密切合作”，但并非创始人，持股情况也不明朗。主持人直言，这更像是一场“very expensive acqui-hire”，为的是把整支工程团队收入麾下。

真正点燃想象力的，是这样一个假设：“the guy who designed the iPhone might actually be fully unleashed to think about the new user experience of an AI powered world.” 当AI不再只是App里的功能，而是成为默认的交互中枢，屏幕、触控、图标这些过去20年的设计共识，是否还成立？

但主持人也保持了谨慎，认为“it does feel a little early for this sort of acquisition”。只是，在OpenAI估值已达3000亿美元、现金充裕的背景下，这种前瞻性下注并非不可能。

DeepMind的非竞业协议：AI人才战争的残酷侧面

如果你想知道AI竞争有多激烈，看看Google DeepMind的做法就够了。Business Insider报道称，DeepMind正在使用极为强硬的非竞业协议，宁可“付钱让员工什么都不做”，也不愿他们跳槽给竞争对手。

部分员工在离职后被要求长达6个月，甚至12个月内不得加入相关公司，这段时间内处于所谓的“garden leave”，继续领取薪水。主持人特别指出，这在科技行业极为罕见，尤其是在加州长期禁止非竞业协议、FTC近期试图全国范围内禁止的背景下。DeepMind之所以能这么做，是因为其总部在伦敦，英国仍允许此类做法。

Google对此回应称：“Given the sensitive nature of our work， we use non-competes selectively to protect our legitimate interests.” 但前员工的感受却更为直接。一位受访者说：“Who wants to sign you for starting in a year？ That's forever in AI.” 对早期初创公司来说，等一个关键研究员半年几乎是不可能的。

这段评论道出了行业的集体焦虑：“AI feels like the first time in my career that you have this insane race like a space race.” 在这样一个赛道里，6个月的领先可能就意味着生死差别。讽刺的是，DeepMind自己也曾是人才流失的受害者——Mustafa Suleyman在2022年离开，Arthur Mensch在2023年出走创立Mistral AI。

Llama与基准测试：当指标开始失去意义

最后一个故事，关乎我们如何“评判”AI模型。Meta否认了关于Llama模型“为跑分而调优”的传闻。生成式AI副总裁Ahmed Al-Dahle在X上表示：“We’ve also heard claims that we trained on test sets. That’s simply not true.” 他将质量不一致归因于模型刚发布、各家实现尚未稳定。

争议的源头是一则Reddit帖子的翻译，称一名自称Meta工程师的人因“被要求混合测试集以达标”而辞职。随后，LM Arena公开了约2000场Llama参与的对战记录，并指出Meta用于参赛的“Llama for Maverick 0326 experimental”实际上是一个针对人类偏好优化过的版本。

尽管LM Arena承认这种做法“并未技术性违规”，但也明确表示：“Meta’s interpretation of our policy did not match what we expected from model providers.” 开发者Vic K在分析结果时给出一个直观例子：Llama在一场对战中击败Claude 3.5 Sonnet，但输出“话多、事实错误”，却依然赢得了用户投票。他的结论是：“This is the clearest evidence that no one should take these rankings seriously.”

主持人最终给出的唯一可行建议是：降低对基准测试的依赖。但问题随之而来——“Then again， how are we going to rate new things？” 这个问题，目前没人有答案。

总结

这期节目看似是四条新闻，实则指向同一个现实：AI正在从技术竞赛，演变为生产力、人才与话语权的全面博弈。Cursor证明了真正有价值的工具会从开发者自发扩散；OpenAI和Jony Ive的传闻展示了对下一代交互的渴望；DeepMind的非竞业协议揭示了人才已成稀缺资源；而Llama的争议提醒我们，指标并不等同于真实能力。对读者而言，最重要的或许不是押注哪家公司，而是看清这场竞赛的规则正在被重写。

关键词： Cursor， Vibe Coding， AI人才竞争， Llama，基准测试

事实核查备注： Cursor用户数：100万；Anyphere ARR：2025年1月1亿美元，3月据彭博社消息翻倍；Cursor定价：个人版20美元/月，商业版40美元/月；OpenAI潜在收购价格：5亿美元；DeepMind非竞业协议时长：6至12个月；相关人物：Sam Altman、Jony Ive、Mustafa Suleyman、Noam Shazeer；LM Arena对Llama的说明与引用原话。

返回文章列表