LLM比人类快20倍：数据标注、程序员与创作者同时被改写的一周

AI PM 编辑部 · 2023年06月19日 · 5 阅读 · AI/人工智能

AI应用开源模型 AI对齐大语言模型 AI Agent AI安全 AI工具生成式AI AI伦理代码生成

正在加载视频...

视频章节

一项新研究给出了一个残酷但清晰的数字：大语言模型在数据标注上，比人类快20倍、便宜7倍，而且还更准。这不是单点突破，而是一连串信号——从程序员到音乐人，从欧盟立法者到广告公司，所有人都在同一周感受到了AI的“真实冲击波”。

LLM比人类快20倍：数据标注、程序员与创作者同时被改写的一周

一项新研究给出了一个残酷但清晰的数字：大语言模型在数据标注上，比人类快20倍、便宜7倍，而且还更准。这不是单点突破，而是一连串信号——从程序员到音乐人，从欧盟立法者到广告公司，所有人都在同一周感受到了AI的“真实冲击波”。

20倍速度，不是噱头，而是一个职业分水岭

Refuel 的研究几乎没有给人留下幻想空间：在多个真实商业数据集上，大语言模型在文本标注任务中的表现，已经全面逼近甚至超过“熟练人类”。GPT‑4 在无微调情况下，与标准答案的一致率达到 88.4%，而人类是 86%。更致命的是效率——20 倍速度，7 倍成本优势。

这意味着什么？数据标注这种过去被视为“AI 产业护城河”的工作，正在迅速坍塌。更重要的是，这并不是在某个狭窄领域发生的：银行客服问题、SEC 文件、毒性检测、电商商品数据、考试题目，甚至沃尔玛和亚马逊的产品信息，模型都能胜任。

视频里有一句判断非常冷静但值得反复咀嚼：有人会把这看成一个岗位类别的消失，也有人会把它看成人类被释放出来，去做更高阶思考的开始。问题不在于哪种说法更“正确”，而在于——你站在哪一边。

程序员已经用脚投票：AI不是未来，是现在

如果你还在纠结“要不要用 AI 写代码”，那你已经落后于现实了。GitHub 的最新调查显示，92% 的开发者已经在工作中使用 AI。不是尝试，不是观望，是已经在用。

这背后的变化不只是 Copilot。一个叫 GPT‑Engineer 的项目正在 GitHub 上爆炸式增长：给它一个 prompt，它可以生成一个“完整代码库”，而不只是函数级别的补全。这标志着一个重要转折——AI 正在从“副驾驶”，变成“能独立完成一段旅程的代理”。

一句话点破现状的是 Chris Castanova 的判断：“AI 不是编程的未来，它是现在。”当 9 成以上的开发者已经默认 AI 是工作流的一部分时，真正的分化只剩下一个问题：你是用 AI 放大自己，还是被会用 AI 的人取代？

立法者、唱片学院和相机厂商，都在同一件事上焦虑

当技术跑得太快，所有人都会显得有点手忙脚乱。欧盟 AI Act 是迄今最全面的 AI 立法尝试，但它明显诞生于“前 ChatGPT 时代”。要求基础模型披露训练数据来源，直接让现有主流模型几乎全部处在潜在不合规边缘。

斯坦福的评估更像是一盆冷水：在合规评分中，Hugging Face 的开源模型反而领先，而 Anthropic 的 Claude 得分垫底。研究者反复强调一个现实问题——很多公司不是做不到，而是“没写清楚”。文档，正在变成新的合规门槛。

与此同时，格莱美奖给出了文化产业的答案：允许使用 AI，但必须有“有意义的人类创作”。尼康的广告则更直白，直接对着 Midjourney 时代喊话：‘不要放弃真实世界’。当一个行业开始公开“反 AI 宣传”，往往意味着，它真的感到威胁了。

总结

这一周的所有新闻，其实都指向同一个事实：AI 不再只是效率工具，而是在重塑“什么工作还值得由人来做”。对从业者来说，最危险的状态不是被 AI 取代，而是低估它已经走到哪一步。短期行动建议很现实：把 AI 纳入你的日常工作流，而不是当成实验；关注合规和数据来源，而不是只盯模型参数；更重要的是，主动寻找那些“AI 做得很好，但还需要你负责判断和承担后果”的位置。真正的分水岭，不是技术，而是选择。

关键词：大语言模型， GPT-4，数据标注， AI Agent， AI立法

事实核查备注：需要核查的关键事实：1）Refuel 研究中“20倍速度、7倍成本”的具体实验设置；2）GPT-4 标注一致率 88.4% 与人类 86% 的对比来源；3）GitHub 调查中 92% 开发者使用 AI 的发布时间与样本规模；4）斯坦福对各大模型 EU AI Act 合规评分的具体方法与时间；5）格莱美奖关于 AI 音乐“有意义人类创作”的官方表述。

返回文章列表