AI正在变得更强,却也更封闭:一份报告撕开行业真相

AI PM 编辑部 · 2023年10月12日 · 6 阅读 · AI/人工智能

正在加载视频...

视频章节

这不是一份歌颂 AI 进步的报告,而是一份让从业者警惕的清单:GPT-4 碾压一切、RLHF 带来真实的人类代价、顶级研究正在集体“关门”,而唯一的例外竟然来自 Meta。Air Street 的《State of AI》透露的信号,比技术本身更值得重视。

AI正在变得更强,却也更封闭:一份报告撕开行业真相

这不是一份歌颂 AI 进步的报告,而是一份让从业者警惕的清单:GPT-4 碾压一切、RLHF 带来真实的人类代价、顶级研究正在集体“关门”,而唯一的例外竟然来自 Meta。Air Street 的《State of AI》透露的信号,比技术本身更值得重视。

GPT‑4 碾压一切,但真正的变化不在性能

在研究部分,Air Street 给出了一个几乎没有悬念、却依然震撼的判断:GPT‑4 已经全面领先现有的大语言模型。不是“略强”,而是“crushes every other LLM”。但真正值得玩味的,并不是榜单排名,而是这句话背后的潜台词——前沿模型之间的差距正在被拉到一个难以追赶的量级

这意味着什么?意味着“追赶 OpenAI”正在从工程问题,变成资源与结构性问题。Scaling 仍然有效,但可供 Scaling 的算力、数据、资金,却越来越集中。对大多数团队来说,下一代模型的竞争,已经不是“能不能做得更好”,而是“还能不能上桌”。

这也是为什么报告在肯定 GPT‑4 的同时,迅速把焦点移开:当领先优势过大,行业的关键变量就不再是模型本身,而是谁还能持续投入、持续试错、持续承受失败成本

RLHF 的成功故事背后,是被忽视的代价

ChatGPT 的成功,让“人类反馈强化学习(RLHF)”几乎成了行业标配。但报告中特意点出一个常被忽略的事实:这一流程对参与其中的人,带来了真实而严重的心理影响

这是一个不太被写进发布会 PPT 的现实。大量标注与对齐工作,意味着长期接触极端、暴力或令人不适的内容。Air Street 并没有夸大技术细节,而是冷静地提醒:当我们不断强调模型“更安全”“更可控”时,是否认真思考过是谁在替模型承受这些风险

更微妙的是,报告还指出,自去年底以来,RLHF 与 instruction tuning 已成为主流路径,但围绕它们的技术(例如 watermarking)本身仍面临不少挑战。这意味着行业在“如何让模型更听话”这件事上,并没有一个完美答案,只是不断在权衡成本、效果与伦理。

前沿研究正在关门,开源不再是默认选项

报告中最具时代感的一点,是对研究文化变化的描述:随着模型能力增强,顶级机构正在系统性地减少公开分享。曾经默认开放、协作的研究氛围,正在被谨慎、保密甚至沉默取代。

原因并不复杂——模型越强,泄露的风险、被滥用的可能性、以及商业竞争的压力就越大。结果就是,很多真正重要的进展,只存在于内部文档和私有实验中。

而最大的“例外”,几乎所有人都想到了:Meta 的 LLaMA。尤其是那些允许商业使用的版本,在一个越来越封闭的环境里显得格外反常。它并不完美,也并非最强,但它释放了一个清晰信号:开源正在从‘理想主义’,变成一种战略选择

算力、政治与安全:真正决定走向的慢变量

进入产业部分,Air Street 把“compute”放在最显眼的位置,几乎没有意外。算力不仅影响模型规模,更深刻地影响谁能持续迭代、谁会被迫退出。而这些限制,会反过来塑造模型的形态与应用边界。

在政治与安全章节,报告没有展开细节轰炸,而是点出一个核心现实:围绕先进 AI 的监管、输入限制和安全讨论,已经成为不可忽视的外部变量。它们不会立刻改变模型能力,却会长期影响研发节奏、产品形态,甚至公司战略。

当报告最后来到预测部分时,语气反而变得克制——趋势清晰,但能否持续,仍有太多不确定性。这种克制,本身就是一个信号。

总结

这份《State of AI》最重要的价值,并不在于告诉你“哪个模型更强”,而在于提醒你:AI 的未来正在被三件事同时塑造——集中化的能力、被忽视的代价,以及逐渐收紧的边界。如果你是从业者,这意味着不能只盯着 benchmark,而要思考你所在的位置是否可持续;如果你在做产品,开源与闭源不只是技术选择,而是长期战略;如果你在押注未来,真正的变量可能不是算法,而是算力、制度与人。一个值得反复问自己的问题是:当行业越来越“关门”,你打算靠什么留下来?


关键词: State of AI, GPT-4, RLHF, 开源模型, LLaMA

事实核查备注: 需要核查:Air Street 为第六年发布《State of AI》报告;视频中关于 GPT-4“crushes every other LLM”的原话语境;RLHF 对标注人员心理影响的具体表述;Meta LLaMA 作为主要开源例外的定位;报告中关于算力与研究页数(约70页)的描述。