GPT-4o 在非洲青年中翻倍提分:一次反直觉的 AI 落地实验
在 OpenAI DevDay 的一个不起眼角落,Dimagi 分享了一个让很多 AI 从业者意外的结论:想把大模型用好在低资源语言上,最聪明的做法,可能不是“直接教模型说当地话”。他们用 GPT-4o mini 做机器翻译微调,把 Sheng 这种混合俚语的翻译 BLEU 分数从 22 拉到 65,成本却只要十分之一。
在 OpenAI DevDay 的一个不起眼角落,Dimagi 分享了一个让很多 AI 从业者意外的结论:想把大模型用好在低资源语言上,最聪明的做法,可能不是“直接教模型说当地话”。他们用 GPT-4o mini 做机器翻译微调,把 Sheng 这种混合俚语的翻译 BLEU 分数从 22 拉到 65,成本却只要十分之一。
在o1模型全面发布之际,OpenAI研究负责人Noam Brown回顾了过去三年对AGI时间线的判断变化,系统阐述了他对预训练经济性、扩展路径、多模态模型以及评测方式的核心看法。这是一场关于“什么真的有效”的冷静反思。
Cohere联合创始人兼CEO Aidan Gomez,既是Transformer论文作者之一,也是少数亲历大模型从学术走向企业落地的人。本篇文章通过他的个人经历与创业思考,讲清楚一个核心问题:为什么真正决定大模型价值的,不只是模型本身。
围绕OpenAI、Google等前沿实验室的最新动向,一场关于“AI是否正在放缓”的争论正在发酵。这并非技术停滞,而是一次深刻的路径转向:从无限扩展预训练算力,走向以推理和测试时计算为核心的新范式。
同一周,三家巨头给了AI行业三种截然不同的答案:Meta把AI做成每个人的“分身”,苹果罕见公开模型细节,谷歌却因为一支广告被群嘲。这不是产品发布合集,而是一次关于AI该走向哪里的集体暴露。
如果你以为大模型的竞争只是算力和算法,那你低估了真正的战场。GPT-4、Bard们的核心燃料,正在把OpenAI、Google、Meta推向同一个法律与伦理灰色地带,而且这不是失误,是战略选择。
如果你还以为 ChatGPT 只是会聊天、写代码,那你已经落后了。就在 3 月中旬,OpenAI 把它装进了一台类人机器人,让 AI 看世界、理解场景、即时行动,还能解释“我为什么这么做”。这不是噱头,而是 AI 正式进入物理世界的关键一跃。
过去一年,AI最稀缺的东西悄悄变了:不是算法,也不是人才,而是算力。美国把算力写进总统行政令,欧洲用超级计算机建“AI工厂”,而中美在芯片对抗的同时却选择在AI安全上合作——这不是巧合,而是AI已经正式升级为地缘政治筹码。
纽约时报起诉 OpenAI,本以为是一次传统媒体维权,却被 OpenAI 反手指控“诱导模型复读”。这不是一场普通的版权纠纷,而是一次可能决定大模型训练合法性的世纪对决。
如果你以为“更强的 AI 只能由更聪明的人来管”,那 OpenAI 刚刚发表的这篇论文,可能会让你皱眉。超级对齐团队的第一个研究结论很反直觉:一个几乎“很笨”的模型,居然能教会 GPT-4 更好地完成任务。这不是噱头,而是 OpenAI 对齐路线的一次重大转向。