被低估的正面进攻:Amazon用Nova重返基础模型牌桌

AI PM 编辑部 · 2024年12月05日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

在被认为“错过一代大模型”之后,Amazon于AWS re:Invent发布Nova模型家族,正式回到基础模型正面竞争。这不仅是一次产品发布,更是一次价格战、基础设施与战略耐心的集中展示。

被低估的正面进攻:Amazon用Nova重返基础模型牌桌

在被认为“错过一代大模型”之后,Amazon于AWS re:Invent发布Nova模型家族,正式回到基础模型正面竞争。这不仅是一次产品发布,更是一次价格战、基础设施与战略耐心的集中展示。

从被ChatGPT打乱节奏,到不得不亲自下场

理解Nova,必须先理解Amazon此前那段有些“被动”的历史。这一点,AI Daily Brief的主持人并没有替Amazon粉饰。视频回顾了一个关键转折:ChatGPT发布后,Amazon原本计划推出自己的聊天模型,甚至已经想好了名字——Bedrock。但当他们意识到自家模型“坦率地说不如ChatGPT”时,做了一个务实却不体面的决定:放弃直接竞争,把Bedrock变成一个AWS服务,帮助企业“选择和管理别人的模型”。

这一步奠定了Amazon过去一年多的AI形象:更像云基础设施提供商,而不是模型创新者。他们一方面加深了与Anthropic的绑定,另一方面押注自研Tranium芯片,强调算力和性价比,而非模型能力本身。但正如视频所说,Amazon显然“不满足于永远不在基础模型牌桌上”。

AWS re:Invent 2024成为转折点。Nova的发布,意味着Amazon正式承认:只靠‘卖铲子’不够,他们也要参与‘淘金’。正如Andy Jassy所说:“我们一直在推进自己的前沿模型,而在过去四到五个月里,这些模型取得了巨大的进展。”这句话背后,是Amazon内部方向的明显转向。

Nova家族全景:一次性补齐的模型矩阵

Nova并不是单一模型,而是一整个“补齐式”的产品线。Amazon一次性发布了四个大语言模型:Nova Micro、Light、Pro 和 Premiere,外加图像生成模型 Nova Canvas 与视频生成模型 Nova Reel。

从定位看,Nova Micro 是纯文本模型,主打速度和成本;Nova Light 是低成本多模态模型,可同时处理文本、图像和视频;Nova Pro 则被定义为“在准确性、速度和成本之间取得最佳平衡”的主力型号;而 Nova Premiere 是目前最强版本,专为“复杂推理任务”和“作为蒸馏教师模型”设计。除了 Premiere 尚未上线,其余模型已进入 Amazon Bedrock 模型库。

技术细节上,Amazon并未公布参数规模,但主持人指出:无论是上下文窗口,还是整体能力描述,Nova显然对标的是最新一代主流模型。更重要的是承诺——Amazon计划在明年为部分模型提供高达200万token的超长上下文窗口,这一数字直接进入行业第一梯队。

在生成模型方面,Nova Canvas 的图像质量“看齐头部实验室”,而 Nova Reel 的视频模型目前仅支持6秒视频、生成时间约3分钟,更像一个预告版本。Amazon明确表示,支持2分钟视频的版本“即将到来”。

基准测试之外:真正的分水岭在价格

如果只看基准测试,Nova Pro 的位置相对清晰:它处在 Claude 3.5 Sonnet、GPT‑4o 这一档“第一梯队”。Amazon声称在部分任务上超过这些模型,也有第三方指出其在 agent 与 multi-agent 基准上表现突出。但视频也强调了另一面:在编码类基准(如 LiveBench)中,Nova Pro 并未登顶,仍落后于 Sonnet 3.5 和 o1 系列。

主持人给出的判断非常克制:“与其纠结具体排名,不如把这些模型理解为处在同一个竞争区间。”真正被低估的,是价格。

Nova Micro 和 Nova Light 的定价低于 Gemini 1.5 Flash 与 GPT‑4o mini,其中 Nova Light 还是“目前来自主要实验室中最便宜的多模态模型”。Nova Pro 的价格大约是 GPT‑4o 或 Claude 3.5 Sonnet 的三分之一,甚至比 Claude 3.5 Haiku 还便宜,但性能显著更高。

LlamaIndex CEO Jerry Liu 的评价一针见血:“Amazon本该把‘降价’放在发布会最显眼的位置。”因为在真实世界中,真正限制多轮、多模态 agent 工作流的,不是模型聪不聪明,而是“用不起”。Nova在这里给出了一个极具攻击性的答案。

不只是模型:Tranium、Apple与算力护城河

视频最后用很大篇幅强调:Nova只是故事的一半。另一半是Amazon正在同步推进的基础设施攻势。

Tranium 2 实例已在AWS全面可用,Amazon宣称其训练和推理速度比第一代提升4倍,在 Meta Llama 405B 上的推理吞吐量比其他云厂商高3倍,并且“性价比比基于H100的EC2实例高30–40%”。更激进的是 Tranium 3:Amazon承诺其速度将是第二代的两倍,同时能效提升40%。

AWS CEO Matt Garman 的一句话颇具挑衅意味:“在GPU那边,几乎只有NVIDIA一个选择。我们认为客户会希望有更多选项。”

真正让现场震动的,是Apple的站台。Apple机器学习与AI高级总监Benoit Dupin罕见登台,确认Apple正在使用Tranium芯片支持搜索等服务,并评估用其预训练 Apple Intelligence 模型。正如主持人所说:“Apple几乎从不公开背书云供应商,这本身就是一次强烈的信任投票。”

再加上与Anthropic合作、号称将成为“全球最大AI训练集群”的Rainier超级计算机,Amazon正在构建一种难以复制的组合:自研模型 + 自研芯片 + 超大规模云分发。

总结

Nova的意义,不在于某一项基准是否第一,而在于Amazon已经完成了从“旁观者”到“全面参赛者”的转身。它用价格打穿使用门槛,用基础设施托底长期竞争。正如视频总结的那样:Amazon并没有跳过这一代大模型,它只是迟到了一点,但现在“完全在局内”。对开发者而言,这意味着一个更便宜、选择更多、且足够强的新时代正在打开。


关键词: Amazon Nova, 基础模型, Amazon Bedrock, Tranium芯片, 多模态AI

事实核查备注: Nova模型家族:Micro、Light、Pro、Premiere;200万token上下文窗口承诺;Nova Reel当前支持6秒视频;Nova Pro价格约为GPT-4o/Claude 3.5 Sonnet的三分之一;Tranium 2性能提升4倍、性价比提升30–40%;Tranium 3预计速度为第二代2倍、能效+40%;Apple确认使用Tranium芯片;Rainier为与Anthropic合作的超大规模训练集群