从Cursor到Llama:AI浪潮下的生产力、权力与失真

AI PM 编辑部 · 2025年04月10日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

这期《AI Daily Brief》串起了四个看似分散却高度相关的故事:Cursor的爆发式增长、OpenAI对新型AI硬件的野心、DeepMind用非竞业协议锁住人才,以及Meta陷入的基准测试争议。它们共同勾勒出当下AI产业的真实图景:自下而上的工具革命、人才争夺的白热化,以及对“指标”的集体焦虑。

从Cursor到Llama:AI浪潮下的生产力、权力与失真

这期《AI Daily Brief》串起了四个看似分散却高度相关的故事:Cursor的爆发式增长、OpenAI对新型AI硬件的野心、DeepMind用非竞业协议锁住人才,以及Meta陷入的基准测试争议。它们共同勾勒出当下AI产业的真实图景:自下而上的工具革命、人才争夺的白热化,以及对“指标”的集体焦虑。

Cursor的一百万用户:一场真正的自下而上革命

为什么Cursor的增长如此值得关注?因为它几乎违背了我们对SaaS成功路径的所有既有认知。三年历史、零市场投放,却成为“有史以来增长最快的初创公司之一”。主持人用一句话点破了关键:“Cursor hit a million users, honestly, without really trying.”

Cursor背后的公司Anyphere在今年1月披露,其年经常性收入(ARR)达到1亿美元,而彭博社的消息称,这一数字在3月已经翻倍。平台目前拥有约100万日活用户,却只有两个极其简单的定价方案:个人版每月20美元,商业版40美元。更耐人寻味的是,Anyphere总裁Oscar Scholes明确表示,Cursor的收入“几乎全部来自个人用户”,而这些人中有大量是在公司工作、却自掏腰包使用工具的程序员。

这揭示了一个重要趋势:AI编码工具的采用并非来自企业IT决策,而是来自一线开发者的真实需求。主持人形容这种情况是“bottom up adoption”,甚至补充说,很多人是在“自己的时间、自己的钱”上使用Cursor。这不是企业采购推动的效率工具,而是程序员主动选择的生产力放大器。

直到现在,Cursor才开始认真对待企业市场:在刻意模糊的企业引导流程下,已经有1.4万家公司注册;仅2月,就有超过4000家公司希望测试产品。Anyphere正在以约100亿美元估值洽谈融资,公司规模却只有约60人。这种“极小团队撬动极大价值”的故事,正是Vibe Coding走向主流的最好注脚。

没有屏幕的手机?OpenAI对AI硬件的早期下注

如果说Cursor代表了软件层面的生产力革命,那OpenAI的最新传闻则指向硬件与交互方式的重构。《The Information》报道称,OpenAI正在讨论收购一家具备“AI原生设备”概念的初创公司,其核心人物正是iPhone设计师Jony Ive,潜在收购价高达5亿美元。

目前披露的信息非常克制:团队只做了“初步设计”,还没有完整原型;设想中的产品包括“没有屏幕的手机”以及其他家庭场景设备。Sam Altman被描述为与该团队“密切合作”,但并非创始人,持股情况也不明朗。主持人直言,这更像是一场“very expensive acqui-hire”,为的是把整支工程团队收入麾下。

真正点燃想象力的,是这样一个假设:“the guy who designed the iPhone might actually be fully unleashed to think about the new user experience of an AI powered world.” 当AI不再只是App里的功能,而是成为默认的交互中枢,屏幕、触控、图标这些过去20年的设计共识,是否还成立?

但主持人也保持了谨慎,认为“it does feel a little early for this sort of acquisition”。只是,在OpenAI估值已达3000亿美元、现金充裕的背景下,这种前瞻性下注并非不可能。

DeepMind的非竞业协议:AI人才战争的残酷侧面

如果你想知道AI竞争有多激烈,看看Google DeepMind的做法就够了。Business Insider报道称,DeepMind正在使用极为强硬的非竞业协议,宁可“付钱让员工什么都不做”,也不愿他们跳槽给竞争对手。

部分员工在离职后被要求长达6个月,甚至12个月内不得加入相关公司,这段时间内处于所谓的“garden leave”,继续领取薪水。主持人特别指出,这在科技行业极为罕见,尤其是在加州长期禁止非竞业协议、FTC近期试图全国范围内禁止的背景下。DeepMind之所以能这么做,是因为其总部在伦敦,英国仍允许此类做法。

Google对此回应称:“Given the sensitive nature of our work, we use non-competes selectively to protect our legitimate interests.” 但前员工的感受却更为直接。一位受访者说:“Who wants to sign you for starting in a year? That's forever in AI.” 对早期初创公司来说,等一个关键研究员半年几乎是不可能的。

这段评论道出了行业的集体焦虑:“AI feels like the first time in my career that you have this insane race like a space race.” 在这样一个赛道里,6个月的领先可能就意味着生死差别。讽刺的是,DeepMind自己也曾是人才流失的受害者——Mustafa Suleyman在2022年离开,Arthur Mensch在2023年出走创立Mistral AI。

Llama与基准测试:当指标开始失去意义

最后一个故事,关乎我们如何“评判”AI模型。Meta否认了关于Llama模型“为跑分而调优”的传闻。生成式AI副总裁Ahmed Al-Dahle在X上表示:“We’ve also heard claims that we trained on test sets. That’s simply not true.” 他将质量不一致归因于模型刚发布、各家实现尚未稳定。

争议的源头是一则Reddit帖子的翻译,称一名自称Meta工程师的人因“被要求混合测试集以达标”而辞职。随后,LM Arena公开了约2000场Llama参与的对战记录,并指出Meta用于参赛的“Llama for Maverick 0326 experimental”实际上是一个针对人类偏好优化过的版本。

尽管LM Arena承认这种做法“并未技术性违规”,但也明确表示:“Meta’s interpretation of our policy did not match what we expected from model providers.” 开发者Vic K在分析结果时给出一个直观例子:Llama在一场对战中击败Claude 3.5 Sonnet,但输出“话多、事实错误”,却依然赢得了用户投票。他的结论是:“This is the clearest evidence that no one should take these rankings seriously.”

主持人最终给出的唯一可行建议是:降低对基准测试的依赖。但问题随之而来——“Then again, how are we going to rate new things?” 这个问题,目前没人有答案。

总结

这期节目看似是四条新闻,实则指向同一个现实:AI正在从技术竞赛,演变为生产力、人才与话语权的全面博弈。Cursor证明了真正有价值的工具会从开发者自发扩散;OpenAI和Jony Ive的传闻展示了对下一代交互的渴望;DeepMind的非竞业协议揭示了人才已成稀缺资源;而Llama的争议提醒我们,指标并不等同于真实能力。对读者而言,最重要的或许不是押注哪家公司,而是看清这场竞赛的规则正在被重写。


关键词: Cursor, Vibe Coding, AI人才竞争, Llama, 基准测试

事实核查备注: Cursor用户数:100万;Anyphere ARR:2025年1月1亿美元,3月据彭博社消息翻倍;Cursor定价:个人版20美元/月,商业版40美元/月;OpenAI潜在收购价格:5亿美元;DeepMind非竞业协议时长:6至12个月;相关人物:Sam Altman、Jony Ive、Mustafa Suleyman、Noam Shazeer;LM Arena对Llama的说明与引用原话。