Sora正式上线：它没解决物理世界，却重新定义了AI视频创作

AI PM 编辑部 · 2024年12月11日 · 11 阅读 · AI/人工智能

Sam Altman 微调幻觉 AI安全世界模型多模态提示工程生成式AI Sora Amazon

正在加载视频...

视频章节

OpenAI终于发布Sora视频生成工具。它在画面质感和创作自由度上令人惊艳，却依然被“物理一致性”拖住后腿。这篇文章将还原视频中的真实体验、争议与洞见，解释为什么Sora更像一次创作范式的转折，而不是技术终点。

Sora正式上线：它没解决物理世界，却重新定义了AI视频创作

OpenAI终于发布Sora视频生成工具。它在画面质感和创作自由度上令人惊艳，却依然被“物理一致性”拖住后腿。这篇文章将还原视频中的真实体验、争议与洞见，解释为什么Sora更像一次创作范式的转折，而不是技术终点。

万众期待后的发布：Sora到底被寄予了什么希望

Sora的发布，本身就是一个故事。视频一开始，主持人就点出背景：在经历了数月等待后，OpenAI终于在“12 Days of Shipmas”期间官宣——“我们的节日礼物是：Sora来了”。在此之前，业内已经形成一种微妙共识：如果Sora不出现，那才是不正常的。

OpenAI对Sora的定位非常明确：它不是一个小功能，而是一个“独立产品”。用户可以通过文本生成视频、让静态图片动起来，或者对已有视频进行延展、混剪和重构。更重要的是，OpenAI强调他们在“界面”和“创作流程”上投入了大量精力，而不仅是模型本身。

主持人特别引用了官方描述：“自今年2月预览Sora以来，我们一直在构建Sora Turbo——一个显著更快的版本。”这句话释放的信号很清晰：Sora并非实验室玩具，而是准备进入真实创作场景的工具。只是，这样的雄心，也让它暴露在更严格的审视之下。

真正的亮点不只是模型，而是Storyboard界面

为什么Sora值得被认真对待？视频给出的答案并不只是“画面更好”。主持人认为，Sora最被低估的创新，恰恰在于它的交互设计。

在基础能力上，Sora支持最长20秒、最高1080p的视频生成（具体分辨率与时长取决于订阅等级）。但更关键的是Storyboard模式：用户可以把多个短片段排列成一个连续视频，模型会尝试自动生成无缝转场，同时允许用户控制剪辑节奏，甚至逐帧输入。

主持人直言：“这是那种会在实际制作层面，真正改变可用性的界面更新。”对比以往AI视频工具“一次生成、不可控、不可编辑”的体验，Sora第一次让创作者感到，AI视频开始像剪辑软件，而不是抽奖机。这也是为什么不少专业人士认为，Sora的意义不只在生成质量，而在于它降低了‘可控创作’的门槛。

供不应求与地区限制：一次有意为之的“饥饿发布”？

Sora上线后，另一个迅速引爆讨论的话题是：你可能根本用不上。Plus用户每月最多50条480p视频，Pro用户最高500条、更高分辨率，但前提是——你得先注册成功。

视频中展示了现实情况：sora.com暂时无法创建新账户。Sam Altman随后在X上回应：“我们严重低估了需求，需要时间让更多人获得访问权限。”但主持人给出了一个更现实的判断：这并非误判需求，而是算力和风险约束下的主动选择——先制造紧张感和话题度。

更具争议的是，Sora暂未在欧盟和英国上线。Altman回应称，OpenAI“希望在欧洲提供产品，但必须遵守监管”。这再次凸显了一个现实：生成式AI的前沿能力，正在被地区监管切割，而这本身也会反过来影响创新节奏。

安全与创作的拉锯：OpenAI为什么选择“保守上线”

Sora迟迟未发布，另一个关键原因是安全。视频明确指出，OpenAI采取的是“先发布，再微调安全”的策略。他们在官方声明中写道：“我们希望给社会时间去探索可能性，并共同建立规范和防护措施。”

Sora符合C2P标准，所有生成视频都可被识别为AI生成并带有水印；涉及真实人物的上传在初期被严格限制，直到深度伪造防护更成熟。Sora产品负责人Rohan Sahi在直播中坦言：“这是一个很陡峭的取舍。”

这种保守直接带来了用户吐槽——例如有人甚至无法生成“熊吃鲑鱼”的画面。但OpenAI的态度很清楚：“我们可能第一天做得不完美，如果限制太严，请给我们反馈。”这是一次典型的安全与创造力之间的博弈，而Sora选择站在了更谨慎的一侧。

最真实的评价：Sora依然没通过“物理测试”

真正让视频精彩的，是大量来自一线用户的真实反馈。科技评测人Marques Brownlee在体验后总结得非常直接：“它有明显的AI痕迹，比如乱码文字，但很多剪辑、运镜和风格化镜头，是Sora自己决定的，而且非常自然。”

问题也同样明显——物理一致性。物体的运动方向、速度、连续性经常出错，出现“缺乏对象恒常性”的情况。Brownlee认为，Sora“还没有解决物理”。

这种评价得到了更多案例印证：鸟类飞行不自然，被调侃为“没有模型通过过鸟测试”；简单的立方体堆叠任务也会失败。但在风景、航拍、卡通或定格动画风格中，Sora反而表现出色，因为物理不精确被‘风格化’掩盖了。

a16z的Anjney Midha给出了一个更宏观的视角：Sora不是世界模拟器，但它将通过新界面收集到海量人类偏好数据，而这“本身就是黄金”。这也许正是OpenAI真正的长期筹码。

总结

Sora并不是一个“完美的视频生成器”，它在物理理解上依然笨拙，在可用性上也受到算力和监管的限制。但这次发布真正重要的，不是它生成了多逼真的画面，而是它让AI视频第一次走向了“可控创作”的方向。对创作者来说，Sora更像一个新工具的起点；对行业来说，它清晰地表明：下一阶段的竞争，不只在模型，而在产品形态和人类反馈的规模。

关键词： Sora， AI视频生成， OpenAI，世界模型， AI安全

事实核查备注：关键事实：Sora由OpenAI发布；支持文本/图像生成视频；最长20秒、最高1080p；Plus用户50条/月（480p），Pro用户500条/月；暂未在欧盟和英国上线；Sam Altman、Rohan Sahi、Marques Brownlee（MKBHD）、Anjney Midha均在视频中被引用；物理一致性和对象恒常性仍是主要问题。

返回文章列表