被低估的正面进攻：Amazon用Nova重返基础模型牌桌

AI PM 编辑部 · 2024年12月05日 · 4 阅读 · AI/人工智能

正在加载视频...

视频章节

在被认为“错过一代大模型”之后，Amazon于AWS re：Invent发布Nova模型家族，正式回到基础模型正面竞争。这不仅是一次产品发布，更是一次价格战、基础设施与战略耐心的集中展示。

被低估的正面进攻：Amazon用Nova重返基础模型牌桌

在被认为“错过一代大模型”之后，Amazon于AWS re：Invent发布Nova模型家族，正式回到基础模型正面竞争。这不仅是一次产品发布，更是一次价格战、基础设施与战略耐心的集中展示。

从被ChatGPT打乱节奏，到不得不亲自下场

理解Nova，必须先理解Amazon此前那段有些“被动”的历史。这一点，AI Daily Brief的主持人并没有替Amazon粉饰。视频回顾了一个关键转折：ChatGPT发布后，Amazon原本计划推出自己的聊天模型，甚至已经想好了名字——Bedrock。但当他们意识到自家模型“坦率地说不如ChatGPT”时，做了一个务实却不体面的决定：放弃直接竞争，把Bedrock变成一个AWS服务，帮助企业“选择和管理别人的模型”。

这一步奠定了Amazon过去一年多的AI形象：更像云基础设施提供商，而不是模型创新者。他们一方面加深了与Anthropic的绑定，另一方面押注自研Tranium芯片，强调算力和性价比，而非模型能力本身。但正如视频所说，Amazon显然“不满足于永远不在基础模型牌桌上”。

AWS re：Invent 2024成为转折点。Nova的发布，意味着Amazon正式承认：只靠‘卖铲子’不够，他们也要参与‘淘金’。正如Andy Jassy所说：“我们一直在推进自己的前沿模型，而在过去四到五个月里，这些模型取得了巨大的进展。”这句话背后，是Amazon内部方向的明显转向。

Nova家族全景：一次性补齐的模型矩阵

Nova并不是单一模型，而是一整个“补齐式”的产品线。Amazon一次性发布了四个大语言模型：Nova Micro、Light、Pro 和 Premiere，外加图像生成模型 Nova Canvas 与视频生成模型 Nova Reel。

从定位看，Nova Micro 是纯文本模型，主打速度和成本；Nova Light 是低成本多模态模型，可同时处理文本、图像和视频；Nova Pro 则被定义为“在准确性、速度和成本之间取得最佳平衡”的主力型号；而 Nova Premiere 是目前最强版本，专为“复杂推理任务”和“作为蒸馏教师模型”设计。除了 Premiere 尚未上线，其余模型已进入 Amazon Bedrock 模型库。

技术细节上，Amazon并未公布参数规模，但主持人指出：无论是上下文窗口，还是整体能力描述，Nova显然对标的是最新一代主流模型。更重要的是承诺——Amazon计划在明年为部分模型提供高达200万token的超长上下文窗口，这一数字直接进入行业第一梯队。

在生成模型方面，Nova Canvas 的图像质量“看齐头部实验室”，而 Nova Reel 的视频模型目前仅支持6秒视频、生成时间约3分钟，更像一个预告版本。Amazon明确表示，支持2分钟视频的版本“即将到来”。

基准测试之外：真正的分水岭在价格

如果只看基准测试，Nova Pro 的位置相对清晰：它处在 Claude 3.5 Sonnet、GPT‑4o 这一档“第一梯队”。Amazon声称在部分任务上超过这些模型，也有第三方指出其在 agent 与 multi-agent 基准上表现突出。但视频也强调了另一面：在编码类基准（如 LiveBench）中，Nova Pro 并未登顶，仍落后于 Sonnet 3.5 和 o1 系列。

主持人给出的判断非常克制：“与其纠结具体排名，不如把这些模型理解为处在同一个竞争区间。”真正被低估的，是价格。

Nova Micro 和 Nova Light 的定价低于 Gemini 1.5 Flash 与 GPT‑4o mini，其中 Nova Light 还是“目前来自主要实验室中最便宜的多模态模型”。Nova Pro 的价格大约是 GPT‑4o 或 Claude 3.5 Sonnet 的三分之一，甚至比 Claude 3.5 Haiku 还便宜，但性能显著更高。

LlamaIndex CEO Jerry Liu 的评价一针见血：“Amazon本该把‘降价’放在发布会最显眼的位置。”因为在真实世界中，真正限制多轮、多模态 agent 工作流的，不是模型聪不聪明，而是“用不起”。Nova在这里给出了一个极具攻击性的答案。

不只是模型：Tranium、Apple与算力护城河

视频最后用很大篇幅强调：Nova只是故事的一半。另一半是Amazon正在同步推进的基础设施攻势。

Tranium 2 实例已在AWS全面可用，Amazon宣称其训练和推理速度比第一代提升4倍，在 Meta Llama 405B 上的推理吞吐量比其他云厂商高3倍，并且“性价比比基于H100的EC2实例高30–40%”。更激进的是 Tranium 3：Amazon承诺其速度将是第二代的两倍，同时能效提升40%。

AWS CEO Matt Garman 的一句话颇具挑衅意味：“在GPU那边，几乎只有NVIDIA一个选择。我们认为客户会希望有更多选项。”

真正让现场震动的，是Apple的站台。Apple机器学习与AI高级总监Benoit Dupin罕见登台，确认Apple正在使用Tranium芯片支持搜索等服务，并评估用其预训练 Apple Intelligence 模型。正如主持人所说：“Apple几乎从不公开背书云供应商，这本身就是一次强烈的信任投票。”

再加上与Anthropic合作、号称将成为“全球最大AI训练集群”的Rainier超级计算机，Amazon正在构建一种难以复制的组合：自研模型 + 自研芯片 + 超大规模云分发。

总结

Nova的意义，不在于某一项基准是否第一，而在于Amazon已经完成了从“旁观者”到“全面参赛者”的转身。它用价格打穿使用门槛，用基础设施托底长期竞争。正如视频总结的那样：Amazon并没有跳过这一代大模型，它只是迟到了一点，但现在“完全在局内”。对开发者而言，这意味着一个更便宜、选择更多、且足够强的新时代正在打开。

关键词： Amazon Nova，基础模型， Amazon Bedrock， Tranium芯片，多模态AI

事实核查备注： Nova模型家族：Micro、Light、Pro、Premiere；200万token上下文窗口承诺；Nova Reel当前支持6秒视频；Nova Pro价格约为GPT-4o/Claude 3.5 Sonnet的三分之一；Tranium 2性能提升4倍、性价比提升30–40%；Tranium 3预计速度为第二代2倍、能效+40%；Apple确认使用Tranium芯片；Rainier为与Anthropic合作的超大规模训练集群

返回文章列表