Llama 3.1 405B 泄露震动行业:开源模型第一次站上王座
一条从 4chan 流出的基准测试,把整个 AI 圈炸醒了:Meta 的 Llama 3.1 405B,可能在多个核心指标上击败 GPT‑4o 和 Claude 3.5 Sonnet。更重要的不是“谁更强”,而是——这一次,站在最前面的,可能是开源模型。
一条从 4chan 流出的基准测试,把整个 AI 圈炸醒了:Meta 的 Llama 3.1 405B,可能在多个核心指标上击败 GPT‑4o 和 Claude 3.5 Sonnet。更重要的不是“谁更强”,而是——这一次,站在最前面的,可能是开源模型。
Sam Altman最近放出一句狠话:只要能走向AGI,一年烧掉500亿美元他也不在乎。这不是情绪宣言,而是一套正在成型的路线图——更大的模型、更聪明的Agent,以及一个全面转向“普通人”的OpenAI。
xAI 传出以240亿美元估值融资60亿美元,很多人第一反应是“疯了”。但如果你把它放进大模型竞赛、GPU军备赛,以及X平台的分发逻辑里看,这可能不是一场任性豪赌,而是一张被迫买下的入场券。
当多数公司还在讨论“要不要用 AI 写邮件”,Moderna 已经要求员工每天用 ChatGPT 20 次,把它塞进科学、法务、制造等几乎所有流程。这次与 OpenAI 的合作,真正震撼的不是医药突破,而是一家企业如何从上到下重做自己。
一个反直觉的结果正在震动AI圈:不是心理安慰,也不是情绪共鸣,而是三轮与GPT-4的理性对话,竟然能让最顽固的阴谋论者显著动摇信念,而且效果持续数月。这不仅关乎辟谣,更关乎AI的说服力边界。
不是科幻,也不是口号。伯尼·桑德斯公开提出:AI带来的生产力提升,应该直接换成“每周32小时、薪水不变”。这一次,AI第一次被推到“社会契约”层面的核心位置。
美国政府出资的一份AI安全报告,突然被媒体包装成“人类灭绝倒计时”。但真正值得警惕的,也许不是AI本身,而是这套被反复复制、不断放大的叙事机制。这篇文章带你拆解:报告到底说了什么,媒体又加了什么,以及这场争论对AI从业者意味着什么。
马斯克起诉OpenAI,指控其背叛“开放使命”。但OpenAI直接放出了邮件证据:转向营利不是背叛,而是马斯克亲自推动的方案之一,甚至包括并入特斯拉。这场纷争,远不只是“开不开源”那么简单。
Anthropic 刚刚发布 Claude 3,就被圈内人一句话点燃:“还没看测试数据,就知道是 GPT‑4 级别。”更耐人寻味的是,一位以爆料 OpenAI 著称的人突然把注意力转向 Anthropic,甚至放话 CEO“正在感受到 AGI”。这不是一次普通的模型更新,而是一次格局变化的信号。
多数人聊大模型,只盯着参数、算力和 Transformer 架构,却忽略了一个更“底层”的事实:模型看到的世界,全是 Token。Andrej Karpathy 用一整期视频,从零实现 GPT Tokenizer,揭示了一个行业共识——Tokenizer,才是真正决定模型能力上限的隐秘开关。