AI正在变得更强，却也更封闭：一份报告撕开行业真相

AI PM 编辑部 · 2023年10月12日 · 6 阅读 · AI/人工智能

开源模型人类反馈强化学习大语言模型 ChatGPT Llama GPT-4 Meta

正在加载视频...

视频章节

这不是一份歌颂 AI 进步的报告，而是一份让从业者警惕的清单：GPT-4 碾压一切、RLHF 带来真实的人类代价、顶级研究正在集体“关门”，而唯一的例外竟然来自 Meta。Air Street 的《State of AI》透露的信号，比技术本身更值得重视。

AI正在变得更强，却也更封闭：一份报告撕开行业真相

这不是一份歌颂 AI 进步的报告，而是一份让从业者警惕的清单：GPT-4 碾压一切、RLHF 带来真实的人类代价、顶级研究正在集体“关门”，而唯一的例外竟然来自 Meta。Air Street 的《State of AI》透露的信号，比技术本身更值得重视。

GPT‑4 碾压一切，但真正的变化不在性能

在研究部分，Air Street 给出了一个几乎没有悬念、却依然震撼的判断：GPT‑4 已经全面领先现有的大语言模型。不是“略强”，而是“crushes every other LLM”。但真正值得玩味的，并不是榜单排名，而是这句话背后的潜台词——前沿模型之间的差距正在被拉到一个难以追赶的量级。

这意味着什么？意味着“追赶 OpenAI”正在从工程问题，变成资源与结构性问题。Scaling 仍然有效，但可供 Scaling 的算力、数据、资金，却越来越集中。对大多数团队来说，下一代模型的竞争，已经不是“能不能做得更好”，而是“还能不能上桌”。

这也是为什么报告在肯定 GPT‑4 的同时，迅速把焦点移开：当领先优势过大，行业的关键变量就不再是模型本身，而是谁还能持续投入、持续试错、持续承受失败成本。

RLHF 的成功故事背后，是被忽视的代价

ChatGPT 的成功，让“人类反馈强化学习（RLHF）”几乎成了行业标配。但报告中特意点出一个常被忽略的事实：这一流程对参与其中的人，带来了真实而严重的心理影响。

这是一个不太被写进发布会 PPT 的现实。大量标注与对齐工作，意味着长期接触极端、暴力或令人不适的内容。Air Street 并没有夸大技术细节，而是冷静地提醒：当我们不断强调模型“更安全”“更可控”时，是否认真思考过是谁在替模型承受这些风险？

更微妙的是，报告还指出，自去年底以来，RLHF 与 instruction tuning 已成为主流路径，但围绕它们的技术（例如 watermarking）本身仍面临不少挑战。这意味着行业在“如何让模型更听话”这件事上，并没有一个完美答案，只是不断在权衡成本、效果与伦理。

前沿研究正在关门，开源不再是默认选项

报告中最具时代感的一点，是对研究文化变化的描述：随着模型能力增强，顶级机构正在系统性地减少公开分享。曾经默认开放、协作的研究氛围，正在被谨慎、保密甚至沉默取代。

原因并不复杂——模型越强，泄露的风险、被滥用的可能性、以及商业竞争的压力就越大。结果就是，很多真正重要的进展，只存在于内部文档和私有实验中。

而最大的“例外”，几乎所有人都想到了：Meta 的 LLaMA。尤其是那些允许商业使用的版本，在一个越来越封闭的环境里显得格外反常。它并不完美，也并非最强，但它释放了一个清晰信号：开源正在从‘理想主义’，变成一种战略选择。

算力、政治与安全：真正决定走向的慢变量

进入产业部分，Air Street 把“compute”放在最显眼的位置，几乎没有意外。算力不仅影响模型规模，更深刻地影响谁能持续迭代、谁会被迫退出。而这些限制，会反过来塑造模型的形态与应用边界。

在政治与安全章节，报告没有展开细节轰炸，而是点出一个核心现实：围绕先进 AI 的监管、输入限制和安全讨论，已经成为不可忽视的外部变量。它们不会立刻改变模型能力，却会长期影响研发节奏、产品形态，甚至公司战略。

当报告最后来到预测部分时，语气反而变得克制——趋势清晰，但能否持续，仍有太多不确定性。这种克制，本身就是一个信号。

总结

这份《State of AI》最重要的价值，并不在于告诉你“哪个模型更强”，而在于提醒你：AI 的未来正在被三件事同时塑造——集中化的能力、被忽视的代价，以及逐渐收紧的边界。如果你是从业者，这意味着不能只盯着 benchmark，而要思考你所在的位置是否可持续；如果你在做产品，开源与闭源不只是技术选择，而是长期战略；如果你在押注未来，真正的变量可能不是算法，而是算力、制度与人。一个值得反复问自己的问题是：当行业越来越“关门”，你打算靠什么留下来？

关键词： State of AI， GPT-4， RLHF，开源模型， LLaMA

事实核查备注：需要核查：Air Street 为第六年发布《State of AI》报告；视频中关于 GPT-4“crushes every other LLM”的原话语境；RLHF 对标注人员心理影响的具体表述；Meta LLaMA 作为主要开源例外的定位；报告中关于算力与研究页数（约70页）的描述。

返回文章列表