OpenAI的Sora视频生成模型也可以渲染视频游戏

Chat中文版

OpenAI的全新、也是首个视频生成模型Sora展示了一些真正令人印象深刻的电影制作技巧。但根据今晚发表的一篇技术论文来看，这个模型的能力实际上比OpenAI最初所展示的要更强大。

标题为《视频生成模型作为世界模拟器》的论文，由一群OpenAI研究人员合著，揭示了Sora架构的关键方面，例如揭示了Sora可以生成任意分辨率和长宽比的视频（最高1080p）。根据论文，Sora能够执行各种图像和视频编辑任务，包括创建循环视频，将视频向前或向后延长时间，以及在现有视频中更改背景。

但对于笔者来说，最引人入胜的是Sora能够"模拟数字世界"，正如OpenAI的合著者所说的那样。在一个实验中，OpenAI让Sora在Minecraft游戏中自由地渲染世界-包括物理学等动态-同时控制玩家。

Chat中文版

那么Sora是如何做到这一点的呢？根据Nvidia研究员Jim Fan（通过Quartz）的观察，Sora更像是一个“数据驱动的物理引擎”而不仅仅是一个创造性工具。它不仅仅生成一张照片或视频，而是确定环境中每个物体的物理特性，并根据这些计算渲染照片或视频（或交互式3D世界）。

合著者写道：“这些能力表明，继续扩展视频模型是开发出高能力的物理世界和数字世界的模拟器以及其中存在的物体、动物和人类的有希望的路径。”

现在，Sora在视频游戏领域仍存在常规的限制。该模型无法准确地模拟基本交互的物理效应，比如玻璃破碎。而且，即使对于可以模拟的交互，Sora也经常出现不一致的情况，例如渲染一个人吃汉堡却无法呈现咬痕。

推荐阅读

美国联邦贸易委员会寻求修改规定以打击深度伪造技术

受到深度伪造技术日益威胁的推动，美国联邦贸易委员会(FTC)正在寻求修改一项现行规定，禁止模仿企业或政府机构的行为，以覆盖所有消费者。根据最终的措辞以及FTC所收到的公众意见，修订后的规定可能还将使对GenAI进行任何形式的冒名顶替变为违法。

OpenAI最新的模型Sora能够生成视频，而且效果还不错

OpenAI紧随Runway等初创公司和Google、Meta等科技巨头的步伐，开始涉足视频生成领域。今天，OpenAI推出了名为Sora的GenAI模型，它可以根据文字提供的简短或详细描述，或者静止图像，生成多角色、不同场景的1080p电影场景。

开放人工智能（OpenAI）无权商标「GPT」

美国专利和商标局拒绝了OpenAI对“GPT”商标的申请，认为这个术语“仅仅是描述性的”，因此无法注册。这对OpenAI的品牌形象是一个打击，但不要期望其竞争对手开始发布自己的版本的无处不在的聊天机器人。ChatGPT肯定是最具辨识度的品牌。

这个德国非盈利组织正在构建一个任何人都可以使用的开放式语音助手

目前已经有许多开源人工智能语音助手的尝试（例如Rhasspy，Mycroft和Jasper），它们都旨在创造出保护隐私、离线使用且不妥协功能的体验。然而，开发工作证明进展非常缓慢。这是因为除了所有与开源相关的常见挑战之外，还存在其他困难。

CodeSignal的Tigran Sloyan谈论如何缩小人才缺口并减少招聘中的偏见

本周，Becca和Dom与CodeSignal技能评估平台的联合创始人兼首席执行官Tigran Sloyan一同合作。