TechCrunch 一分钟:超过 10 万个 YouTube 视频被抓取用于为苹果、英伟达训练人工智能

AI7号2024-07-182511

MrBeast、约翰·奥利弗(John Oliver)和《华尔街日报》有什么共同点?他们的 YouTube 视频文字记录已被抓取,用于训练诸如 Anthropic、英伟达(Nvidia)、苹果(Apple)和 Salesforce 等公司使用的人工智能。

《连线》(Wired)和“Proof News”的一项调查发现,这个名为“YouTube 字幕”的数据集包含了来自超过 48,000 个不同频道的逾 173,000 个 YouTube 视频的文字记录。

这种人工智能抓取数据的现象是整个科技行业都面临的一个问题。应用程序 Cara 的艺术家兼创始人张婧娜(音译)试图通过建立一个不会出卖艺术家的社交平台来保护他们。芝加哥大学正在研究“夜影”(Nightshade)项目,该项目可以对图像进行“下毒”,以限制人工智能从中获取的信息。

但是创作者们真的有办法保护自己不成为下一个受害者吗?更多内容请关注 TechCrunch 一分钟。