Bard突然提升30%,但真正让巨头紧张的不是聊天机器人

AI PM 编辑部 · 2023年06月08日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

Google说Bard一夜之间“聪明了30%”,Sam Altman却反复强调GPT‑5还没开始训练;一边是算法突进,一边是监管、诉讼和开源失控的暗流。这不是一次产品更新,而是AI竞赛规则正在改变的信号。

Bard突然提升30%,但真正让巨头紧张的不是聊天机器人

Google说Bard一夜之间“聪明了30%”,Sam Altman却反复强调GPT‑5还没开始训练;一边是算法突进,一边是监管、诉讼和开源失控的暗流。这不是一次产品更新,而是AI竞赛规则正在改变的信号。

Bard不只是“更会聊天”,而是偷偷学会了写代码

Google这次给Bard加的,并不是更大的模型,而是一种听起来很低调、但后劲十足的新机制:Implicit Code Execution(隐式代码执行)。简单说,当Bard判断一个问题“该用算的”,它会在后台生成并执行代码,再把结果转成自然语言回答。结果是:在数学和文字推理任务上的准确率提升了30%。

这背后其实是一个很反直觉的判断——大模型并不适合硬算。Google在博客里直接承认:LLM更像“预测下一个词的引擎”,在创意和语言上很强,但在逻辑和数学上先天吃亏。解决方案不是继续堆参数,而是让模型学会在必要时调用另一种“思考系统”。他们甚至点名致敬了《思考,快与慢》里的双系统理论。

这意味着什么?意味着下一阶段的AI竞争,重点可能不再是“谁的模型更大”,而是“谁更懂得什么时候不用模型本身”。对AI从业者来说,这是一个明确的信号:工具链和架构设计,正在变得和模型同等重要。

DeepMind和OpenAI,走向了两条完全不同的路

就在Bard更新的同时,DeepMind在《Nature》上扔出了一篇更“硬核”的论文:AlphaDev。它没有从现有算法优化,而是直接从计算机的汇编指令开始,通过强化学习“玩游戏”,奖励目标只有一个——谁跑得更快谁赢。

结果是,它找到了更快的排序算法,并把哈希算法的速度提升了30%。排序和哈希听起来基础,却是社交媒体推荐、数据处理、系统性能的地基。这也是为什么DeepMind的Alpha系列,从AlphaGo开始,就总是盯着“最底层的能力”。

对比之下,Sam Altman的表态显得异常克制。他在国会作证后再次强调:OpenAI“还没有开始训练GPT‑5”,因为在那之前,还有很多新的想法需要验证。更耐人寻味的是他关于不上市的解释——一旦涉及超级智能,可能必须做出让公共市场投资者“无法理解”的决定。

一个在向下挖算法地基,一个在刻意放慢下一代模型的节奏。这并不是谁快谁慢的问题,而是路线选择已经开始分化。

失控的风险,正在从技术问题变成现实问题

技术在加速,麻烦也同步到来。美国已经出现了可能是首例针对生成式AI的诽谤诉讼:一名电台主持人起诉OpenAI,原因是ChatGPT“编造”他挪用公益资金的说法。律师的那句话很重:“明知会胡编,却仍然对公众开放,是不负责任的。”

另一边,Meta的LLaMA模型泄露引发了参议员的强烈不满,直指开源模型可能带来欺诈、隐私和网络犯罪风险。讽刺的是,几周前那份爆火的Google内部备忘录还认为,正是LLaMA的泄露,点燃了整个开源生态的爆发。

而当监管者一边警惕风险,一边又开始“自己用AI”——比如微软把GPT‑4带进Azure政府云,服务国防部、NASA——一个现实已经很清楚:AI不可能被简单地关掉,只能被更复杂地管理。

顺带一提,在模型与监管的拉锯之外,Runway的Gen‑2已经向所有人开放。从文本到视频,创作门槛再次被掀翻,导演这个身份,第一次看起来像是“软件功能”。

总结

把这些碎片放在一起看,会发现一个清晰的趋势:AI行业正在从“模型竞赛”,转向“系统竞赛 + 风险博弈”。更聪明的不一定是更大的模型,而是更懂得如何调用工具、更知道边界在哪里的系统。

对从业者来说,有三点takeaway:第一,别只盯着参数和榜单,关注模型如何与代码、工具、环境协同;第二,安全、合规和责任,已经开始真实地影响产品路线;第三,多模态和生成式工具正在重塑创作职业边界,早用的人,会先获得审美和流程上的优势。

一个值得思考的问题是:当AI既能“算得更准”,又能“被更多人用”,你所在的岗位,究竟更接近被放大,还是被替代?


关键词: Bard, 隐式代码执行, AlphaDev, GPT-5, AI安全

事实核查备注: Bard数学与文字推理准确率提升30%;Implicit Code Execution概念来源与官方表述;AlphaDev在《Nature》发表并提升排序与哈希速度约30%;Sam Altman多次公开表示尚未训练GPT-5且无IPO计划;首例针对ChatGPT的诽谤诉讼细节;LLaMA泄露引发参议员Blumenthal与Hawley表态;GPT-4进入Azure政府云;Runway Gen-2全面开放时间。