斯坦福给AI打透明度分:Llama 2第一,GPT‑4竟然只排第三
如果你以为最强的AI一定最透明,这份斯坦福最新榜单会直接打脸。研究者用100个指标给主流大模型打分,结果显示:Meta 的 Llama 2 拿下第一,但也只及格一半;而整个行业,在“黑箱”这件事上几乎是集体失分。
如果你以为最强的AI一定最透明,这份斯坦福最新榜单会直接打脸。研究者用100个指标给主流大模型打分,结果显示:Meta 的 Llama 2 拿下第一,但也只及格一半;而整个行业,在“黑箱”这件事上几乎是集体失分。
这期 No Priors 播客中,Google Cloud CTO办公室生成式AI负责人 Kawal Gandhi 罕见地系统讲述了 Google 内部如何使用生成式AI、再将其产品化并推向企业市场的全过程。从 Workspace 的“狗粮实验”,到企业采用大模型的真实路径,再到成本、信任与多模态的未来,这是一份来自一线的冷静判断。
当所有人都在追逐更大、更封闭的模型时,Mistral 联合创始人 Arthur Mensch 却反其道而行,公开模型权重、押注开源,并直言:只有拿到权重,才真正谈得上安全与可控。这场与 Stripe 创始人 John Collison 的炉边谈话,透露了欧洲 AI 的另一种未来。
Anthropic刚拿下亚马逊数十亿美元投资,转身又被曝与Google洽谈新一轮融资,估值直冲200-300亿美元。这不是一轮普通融资,而是一场关于云、芯片、开源与AI安全的全面对撞,正在重塑AI权力版图。
摩根大通CEO一句“未来每周只工作3.5天”,听起来像鸡汤,却意外揭开了AI时代最真实的矛盾:生产力暴涨,但我们真的会更轻松吗?从工作时长、搜索垄断,到开源AI与资本博弈,这期视频给了从业者一组必须消化的信号。
当媒体开始高喊“AI泡沫破裂”,真正拿到1.55亿美元、估值14亿美元的AI独角兽却悄然出现。这期视频揭示了一个反直觉真相:AI没有救活旧的硅谷模式,但正在逼迫创业者和投资人回到更残酷、也更健康的现实。
OpenAI看似稳坐王座,但真正的威胁可能并不来自Google,而是Meta押注开源的“慢刀”。从Llama到Code Llama,Meta正在用免费、可定制、可私有化的模型,切开AI商业最赚钱的入口。
一天之内,Snapchat 的 AI 突然“自己发朋友圈”,伯克利科学家用脑电还原出 Pink Floyd,而 DeepMind 前掌门人公开质疑开源 AI。三个看似不相干的事件,指向同一个现实:AI 正在越过我们心理预期的安全边界。
在 Stripe AI Day 的 AI Dev Tools 圆桌上,一个反直觉的共识不断被重复:真正拖慢 AI 落地的,从来不是模型能力,而是检索、部署和工程化细节。Zapier、LlamaIndex 等一线玩家,罕见地把“踩过的坑”摊开来讲。
Hugging Face 并非一开始就要做“AI 的 GitHub”。从一次展会上的偶遇、一个无聊的 AI 助手想法,到押注开源 Transformer,这家公司走出了一条高度非线性的路径。本文还原 Clem Delangue 的真实叙述,讲清 Hugging Face 为什么能成为开源 AI 的核心基础设施。