中国的创造性视频竞争升温

Chat中文版

在周一，中国互联网巨头腾讯在GitHub上发布了其开源视频生成模型DynamiCrafter的新版本。腾讯以其电子游戏帝国和聊天应用微信而闻名，这是提醒人们中国一些最大的科技公司正在悄然加大力度进入文本和图像转视频领域。

与市场上其他生成视频工具一样，DynamiCrafter 使用扩散方法将字幕和静态图像转化为几秒钟的视频。在物理学上受到扩散现象的启发，机器学习中的扩散模型可以将简单的数据转化为更复杂和逼真的数据，就像粒子从高浓度区域移动到低浓度区域一样。

动力创作的第二代产品以640×1024的像素分辨率制作视频。这是在十月份首次发布的320×512视频的升级版本。动力创作团队发表的一篇学术论文指出，该技术不同于竞争对手的地方在于，它将图像动画技术应用范围扩大到“更通用的视觉内容”。

论文中表示：“关键思想是通过将图像纳入生成过程作为指导，利用文本到视频扩散模型的动态特征先验。”相比之下，“传统”技术“主要侧重于利用随机动力学（例如云和流体）或特定领域的动作（例如人体头发或身体动作）来使自然场景动画化。”

在下面的演示中，比较了DynamiCrafter、Stable Video Diffusion（于11月发布）和最近备受瞩目的Pika Labs。可以看出，腾讯模型的效果似乎比其他模型更加生动。不可避免地，在选择的样本中有利于DynamiCrafter，并且在我最初的几次尝试之后，没有一个模型给人以人工智能即将能够制作完整电影的印象。

尽管如此，随着生成文字和图像的繁荣，生成视频被寄予了很高的期望，被视为AI竞赛中的下一个焦点。因此，预计初创公司和科技巨头们都在该领域投入资源。中国也不例外。除了腾讯，抖音的母公司字节跳动、百度和阿里巴巴也分别发布了他们的视频扩散模型。

字节跳动的魔力视频和百度的UniVG都在GitHub上发布了演示，但似乎都还没有对公众开放。与腾讯一样，阿里巴巴也已将其视频生成模型VGen开源，这是中国科技公司越来越受欢迎的策略，希望能触达全球开发者社区。

推荐阅读

Colossyan使用GenAI创建企业培训视频

大多数人不会观看企业培训视频，或者在强制培训的情况下，也不会全神贯注地观看。根据视频技术提供商Kaltura最近的一项调查显示，75%的员工承认只是匆匆浏览培训视频，无声观看或者在同时进行其他任务时倾听。因此，考虑到培训的情况，企业需要思考如何去吸引员工的注意力，以保证培训的有效性。

2024-02-062050

英国政府大力推出价值超过1亿美元的计划，激发“负责任”的人工智能研发

英国政府最终公布了对去年三月份启动的AI监管咨询的回应。去年三月，英国政府发布了一份白皮书，明确了他们优先依靠现有法律和监管机构，并结合"情境特定"指导来轻监管这个颠覆性的高科技行业。完整的回应将被公开发布。

2024-02-061678

巴姆布尔的新人工智能工具可识别并封堵欺诈账号和虚假个人资料

Bumble今天宣布推出一项新的AI功能，旨在帮助识别垃圾信息、欺诈和假档案。这个名为“Deception Detector”的新工具旨在在Bumble用户接触之前就对恶意内容采取行动。在测试中，Bumble发现该工具能自动阻止95%的...

2024-02-052423

尽管全球疯狂，投资者对中国人工智能创业公司的热情渐渐减弱

到了2023年，人工智能带来的全球狂热在ChatGPT的问世推动下席卷全球。在中国，由于OpenAI的聊天机器人不可用，初创公司和科技巨头争相开发自己的人工智能模型和应用，借鉴了这个美国新兴企业的基础部分。个别的人工智能爱好者通过网络访问ChatGPT...

2024-02-051652

Jua筹集1600万美元，致力于构建适用于自然世界的基础AI模型，首要领域是天气预报

大型人工智能模型——用于提供生成式人工智能服务的大量语言、视觉和音频数据——正在成为人工智能发展上与操作系统在智能手机发展上一样重要的因素：它们在某种程度上看起来像是该领域的平台（一个...）。

2024-02-05152