Sora动力短视频的创作者解释AI生成视频的优势和局限性

Chat中文版

OpenAI的视频生成工具Sora在二月份给AI社区带来了惊喜，展示出流畅、逼真的视频，似乎领先于竞争对手。但这次精心策划的发布遗漏了很多细节 — 这些细节被一位获得提前访问权限的电影制作人填补了，他使用Sora制作了一部短片。

Shy Kids是一支总部位于多伦多的数字制作团队，被OpenAI选中作为少数几个为OpenAI宣传目的制作短片的团队之一，尽管在创作"air head"时他们有相当大的创作自由。在接受视觉效果新闻媒体fxguide采访时，后期制作艺术家Patrick Cederberg描述了他的工作中“实际上使用Sora”的一部分。

对大多数人来说，也许最重要的一点就是：尽管OpenAI的帖子强调短片让读者以为它们几乎是完全从 Sora 中产生出来的，但事实是这些都是专业制作，包括完整的分镜头、编辑、色彩校正以及后期工作像是描边和特效。就像苹果说“用iPhone拍摄”但并没有展示摄影棚设置、专业的灯光以及颜色工作，Sora 的帖子只是谈论它可以让人们做什么，并没有说明他们到底是怎么做到的。

塞德伯格的采访很有趣，而且非常不太技术性，所以如果你有兴趣，可以去fxguide阅读一下。不过关于使用Sora的一些有趣信息告诉我们，尽管它令人印象深刻，但这个模型也许并没有我们想象的那么大的飞跃。

换句话说，在传统电影制作中简单的事情，比如选择一个角色的服装颜色，都需要在生成系统中进行复杂的变通和检查，因为每个镜头都是独立制作的。这显然可能会改变，但目前肯定更加费时费力。

Sora的输出也必须注意不期望的元素：Cederberg描述了模型经常会在气球上生成一个脸，而主角的头就在这气球上，或者前面挂着一根绳子。如果无法及时排除这些元素，就需要在后期将它们删除，这是另一个耗时的过程。

角色或相机的精准定时和移动并不是完全可能的：“在实际生成过程中，这些不同的动作发生的时间有点时间控制，但并不是精确的……这有点像瞎编。”Cederberg说道。

例如，确定类似挥手这样的手势的时机是一个非常粗略、建议驱动的过程，不像手动动画那样精确。而像向上移动人物身体的平移镜头可能与电影制片人想要的不符-所以在这种情况下，团队渲染了一个竖屏方向构图的镜头，然后在后期裁剪为平移。生成的视频剪辑也经常没有特定理由地放慢了速度。

Chat中文版

事实上，Cederberg说，使用像“向右移动”或“跟踪镜头”这样的日常电影语言通常不一致，整个团队都觉得相当惊讶。

“在与艺术家合作之前，研究人员并没有真正像电影制片人那样思考，”他说。

因此，团队进行了数百次拍摄，每次只有10到20秒，最终只使用了少数几次。瑟德贝格估计比例为300:1 - 但当然我们在普通拍摄中的比例可能会令我们惊讶。

团队实际上制作了一个幕后视频，解释了一些他们遇到的问题，如果你感兴趣的话。就像许多与人工智能有关的内容一样，评论对整个努力都挺批评的，虽然没有最近被抨击的人工智能辅助广告那么恶毒。

最后一个有趣的细节与版权有关：如果你让Sora给你一个“星球大战”的片段，它会拒绝。如果你试图用“身穿长袍的男人持有激光剑站在一个复古未来飞船上”的方式规避，它也会拒绝，因为它通过某种机制识别出你的意图。它还拒绝执行“阿罗诺夫斯基式镜头”或“希区柯克变焦”。

一方面，这是完全合理的。但这也引发了一个问题：如果Sora知道这些是什么，这是否意味着模型是在这些内容上进行训练，以更好地识别侵权行为？OpenAI一直对其训练数据保密得近乎荒谬，就像首席技术官米拉·穆拉蒂与乔安娜·斯特恩的采访一样，几乎肯定永远不会告诉我们。

至于Sora在电影制作中的应用，显然它是一个强大而有用的工具，但它的作用并不是“从一块白布上创作电影”。不过。正如另一个恶棍曾经著名地说过的那样，“那会在以后”。

推荐阅读

Meta AI测试：不能充分证明自己的存在，但免费就是免费

Meta的新大型语言模型Llama 3支持创新命名的“Meta AI”，这是一款新的聊天机器人，社交媒体和广告公司已经尽可能地安装在他们的应用程序和界面中。与其他通用对话人工智能相比，这个模型如何？它往往会大量重复网络搜索内容。

2024-04-262646

照片分享社区EyeEm将授权用户的照片用于训练人工智能，如果用户不删除这些照片

总部位于柏林的照片分享社区EyeEm，去年破产后被西班牙公司Freepik收购，现在开始授权用户的照片用于训练人工智能模型。本月初，该公司通过电子邮件通知用户，他们将在服务条款中加入新条款，授予其上传照片的权利。

2024-04-26554

科技概要：兔子的R1 vs 人道的气平，谁的发布效果更好？

经过在 CES 上成功的首次发布之后，Rabbit 让记者们试用 R1 — 一款配备 AI 语音界面的小型橙色设备。就在几周前，Humane Ai Pin 推出，也是打造成一种以 AI 为中心的新型移动设备。尽管我们仍然...

2024-04-26849

咨询公司为其应用中的“人工智能新闻主播”Rio筹集资金

人工智能可能正在悄悄地进入新闻编辑室，像《新闻周刊》、《体育画报》、《Gizmodo》、《VentureBeat》、《CNET》等媒体已经开始尝试用人工智能撰写文章。但是大多数受人尊敬的记者会谴责这种应用，但也有一些创业公司认为人工智能可以提升新闻体验——至少在某些方面。

2024-04-26139

OpenAI 创业基金悄然筹集了1500万美元

OpenAI创业基金是与OpenAI相关但在技术上是独立的风险基金，它投资于教育、法律和科学等早期阶段的人工智能相关公司，已悄无声息地完成了一笔1500万美元的交易。根据向美国证券交易委员会提交的文件，两位未透露姓名的投资者共提供了1500万美元。

2024-04-261264