在 Midjourney 出现之前,就有 NightCafe 了——而且它仍在活跃。

AI7号2024-08-312973

Chat中文镜像

埃勒·拉塞尔(Elle Russell)是总部位于澳大利亚凯恩斯的 NightCafe 的联合创始人,该公司提供一系列由人工智能驱动的艺术创作工具,而她本人更愿意避开聚光灯。

“我喜欢躲在我的显示器后面。”她在最近的一次采访中告诉我。

NightCafe(夜咖)同样低调。

五年前,拉塞尔帮助她的伴侣安格斯·拉塞尔(Angus Russell)创立了这家公司。与 Midjourney 等一些竞争对手相比,这家公司没有获得同样的关注度。然而,据艾尔(Elle)称,NightCafe 完全是一家自力更生的企业,“大多数月份”都能盈利,其影响力巨大。其超过 2500 万用户使用其工具创作了近 10 亿张图片。

为了揭开网络上最古老的生成艺术市场之一的神秘面纱,我与艾尔(Elle)谈到了 NightCafe 的起源、该平台面临的一些挑战,以及她和安格斯(Angus)认为它今后的发展方向。

一个关于墙面艺术的网站

正如 NightCafe 的创立故事所述,安格斯最近搬进了悉尼内西区的一套半独立式住宅,还没来得及用大量艺术品来装饰它。“你应该弄些艺术品,墙壁光秃秃的。”一位客人说道。安格斯虽然认同,但在网上找不到能让他心动的印刷品。

因此,在 2019 年,拥有设计学位并且曾联合创办过几家以设计为重点的初创公司的安格斯开始了一项副业:创建了一个人们可以买卖人工智能生成的艺术作品的网站。他以文森特·梵高的《夜间咖啡馆》将其命名为 NightCafe。

这是一次彻底的失败。

人们喜欢创作这种艺术,NightCafe 对此不收费。但他们不想为墙面印刷品付费,而这是该网站唯一的盈利方式。

后来在一个关键的星期里,安格斯注意到他的托管费用比平时高出了几百美元。有人在短短几天内生成了数千张图片。他实施了一个信用系统以防止这种情况再次发生。

不久之后,安格斯的收件箱里充斥着添加购买更多积分选项的请求,他照做了。几乎一夜之间,该网站实现了收支平衡。

就在这时,艾尔加入了 NightCafe,负责公司的业务方面。她说:“我拥有商业和传播学两个本科学士学位,而且我还是一名注册会计师。这很合理。”

NightCafe(夜咖)的火爆成功

几年后的 2021 年年中,当 OpenAI 宣布推出 DALL-E 时,NightCafe 迎来了第二次重大突破。

DALL-E 是 OpenAI 的首个图像生成人工智能模型,在当时处于最先进水平。OpenAI 选择不发布它,但没过多久,爱好者们就设法对 DALL-E 背后的一些方法进行了逆向工程,并构建了自己的开源模型。

安格斯一直在密切关注事态发展,很快就在 NightCafe 上努力获取了更受欢迎的 DALL-E 替代品之一——VQGAN + CLIP。他花费大量资金购买了数百个 GPU 来扩大其规模。

这项投资很快就收回了成本。

用 NightCafe 的 VQGAN + CLIP 创建的图像在 Reddit 上爆火;NightCafe 单日收入 17,000 美元。安格斯决定辞去在 Atlassian 的工作,全职致力于这个平台。

“一个模范市场”

如今的“夜咖”与几年前的“夜咖”大不相同。

该平台仍在自己的服务器上运行一些模型,包括最新版本的 Stable Diffusion 和 Ideogram。但它也整合了提供这些服务的人工智能供应商的 API,为第三方生成器提供了相当于定制界面的服务。

也就是说,NightCafe 在包括 OpenAI、谷歌和黑森林实验室等其他地方的模型之上叠加了工具。而且,自 2019 年以来,该网站为想要将他们生成的任何艺术品印在马克杯、T 恤和印刷品上的客户提供打印服务。

“我们是一家用户界面和社区公司,”艾尔说。“NightCafe 没有任何内部的人工智能或机器学习能力;我们汇集了现有的图像模型,并让它们变得有趣且易于使用。”

在 NightCafe 的聊天室中,用户可以分享他们的作品并进行合作,或者发起“AI 艺术挑战”。该平台还举办官方竞赛,人们可以提交他们的创作以获得重点展示的机会。

去年,NightCafe 推出了微调功能,用户可以通过上传示例图片来训练模型,以重新创建特定的风格、面孔或物体。在 NightCafe 上的微调模型受到一定的限制;例如,不能使用展示裸体、名人或 18 岁以下人群的图片进行训练,并且必须经过 NightCafe 审核团队的人工批准。(这是为了降低深度伪造的风险。)

NightCafe 可以免费使用,但有一定的图像数量限制。可以按需购买图像生成积分包,部分功能需要订阅才能使用。费用从每月 4.79 美元到 50 美元不等(低于 Midjourney 和 Civitai),用户可以优先使用更强大的模型,能够给创作者打赏,拥有上述微调功能以及更高的图像生成数量限制。

这是一种对 NightCafe 效果极佳的模式。

一位接近该公司的消息人士向 TechCrunch 透露,NightCafe 的年化收入为 400 万美元,毛利率接近 50%,这意味着 NightCafe 在扣除费用(包括其 9 名员工的工资)后,每年的利润约为 200 万美元。

艾尔称,每月大约有一百万人访问 NightCafe,其中有两万人订阅了服务。

她说:“任何在线的人工智能艺术生成器都在争夺同一批人的钱,不过我们的用户年龄比该行业的许多用户更大。我们认为我们最大的竞争对手是其他拥有强大社区的应用程序:Leonardo、Civitai 和 Midjourney。”

对人工智能艺术的版权担忧

通过选择不训练自己的人工智能(以及适度调整微调),NightCafe 试图避开法律僵局,该僵局已经困住了许多其整合模型的人工智能供应商。

Stability AI、Midjourney 以及另外两家模型提供商 DeviantArt 和 Runway 面临着一场集体诉讼,该诉讼由一些艺术家提起,他们声称这些供应商未经许可在艺术作品上训练其模型,从而构成了版权侵权。(这些供应商主张合理使用的抗辩。)该诉讼的部分内容已被驳回。但本月初,一名联邦法官允许其进入证据开示阶段。

NightCafe 可能受到《通信规范法案》第 230 条的保护,该条款规定用户而非平台对非法内容(如侵犯版权的艺术品)负责,只要平台应要求删除相关内容。NightCafe 的总部所在地澳大利亚有《广播服务法案》,该法案与第 230 条非常相似,但不同之处在于,如果未能迅速删除“极端暴力材料”,将征收更高的附加费用。

当然,如果法院裁定 NightCafe 所使用的模型本质上是抄袭机器,那将对该公司的业务造成破坏。但对于 NightCafe 的用户以及他们生成的艺术作品所涉及的版权问题又当如何呢?

根据该平台的服务条款,在承认此类作品具有版权的国家(如美国),用户对其人工智能生成的作品保留版权——至少只要获得在作品中使用任何第三方品牌、标识或商标的许可。

NightCafe 博客去年 5 月的一篇帖子进一步阐明了这一点:“合法的创作者会认识并承认用于创作其图像的灵感源自何处。AI 艺术创作工具也在迅速发展,正在开发的系统旨在支持当前的创作环境,同时确保用户只有在原艺术家[同意]的情况下才能获取素材——这在很大程度上与允许使用免版税的摄影图片但需注明创作者的方式相同。”

换句话说,在 NightCafe 看来,是用户而不是 NightCafe 自身需要做好防范。而且如果他们不这样做,该平台不会保护他们免受知识产权所有者的愤怒追责。

但似乎知识产权所有者并没有吓到很多用户。

对 NightCafe 的粗略搜索会出现宝可梦和唐老鸭的图像、布兰妮·斯皮尔斯等名人、可口可乐和乐高等品牌,以及斯坦利·“Artgerm”·刘等艺术家风格的艺术作品。似乎没有一个是在版权所有者的许可下生成的。

当被问及此事时,艾尔说:“用户还可以举报那些通过自动过滤器的内容,而且我们有一支人工审核团队全天候工作,审核被标记的内容。”

政治政策和深度伪造

在我对 Elle 的采访逐渐转向适度的话题时,我们深入探讨了 NightCafe 的一般内容指南,特别是其关于政治和深度伪造的政策。

包括 Midjourney 在内的平台已采取措施,在美国总统大选前禁止用户生成唐纳德·特朗普和卡玛拉·哈里斯等政治人物的图像。但据艾尔称,NightCafe 没有这样做,并且也不打算这样做。

她说:“生成特朗普和其他政治及公众人物的图像是被允许的。然而,我们不希望 NightCafe 成为政治争论的场所。”

NightCafe 怎么能两头兼顾呢?虽然该平台不会阻止用户在其他地方发布政治图片,但如果用户试图将这些图片发布到 NightCafe 的公共信息流中,平台就会将其标记以供审核。

既然如此,在 NightCafe 的公共图库中找到拜登坐轮椅、特朗普持枪以及哈里斯的可疑表情包的图片轻而易举。民意调查显示,大多数美国人担心人工智能宣传和深度伪造内容的传播,而 NightCafe 无疑没有让自身的监管变得更容易。

至于什么内容被允许或不被允许:这得视情况而定。

“政治诱饵”、美化分裂人物或者故意使用丑化或贬低的图像,都是不被允许的(不管我的搜索结果如何)。大多数普通人认为有害或冒犯的内容也是被禁止的;NightCafe 的社区标准列表明确指出了诸如种族主义和仇视同性恋的图像、垃圾邮件、冒犯性的脏话、恐怖主义主题、嘲笑残疾人的图像以及仇恨团体和象征的描绘等内容。

这些主题在技术上可能是不被允许的。但是,在 NightCafe 的搜索栏中输入“自杀式炸弹袭击者”这样的词汇,很有可能你至少会遇到一张似乎违反该平台规则的图片。

Elle 告诉我,最终由版主来解读 NightCafe 的准则,反复发布被禁止类别的图片,或者规避自动过滤器,可能会导致警告或封禁。

鉴于 NightCafe 的规模(以及该网站用户每天至少生成 700 张图片这一事实),其审核团队规模相当小:有 5 名带薪审核员和 20 名志愿者审核员,志愿者们会以 NightCafe 高级功能的形式获得报酬。带薪审核员负责监督内容,而志愿者则处理评论、NightCafe 的聊天室以及微调模型队列。

考虑到内容审核员的工作条件往往很差,我向艾尔询问了更多关于 NightCafe 审核员招聘做法的信息。她说,付费团队是通过一家位于印度尼西亚的外包公司运作的(她不愿透露是哪家),并由 NightCafe 的内部工作人员监督。

艾尔说,所有带薪的版主都能拿到“市场工资”。(截至 2024 年初,雅加达的最低工资约为每月 325 美元。)

与 Civitai 类似,NightCafe 对“NSFW”(不适合工作场所浏览)内容有政策例外:不包括全裸,但允许有暗示性的姿势(如“袒胸露臀”)、血腥暴力、战争的直观描绘以及非法药物使用的图像(例如,抽大麻烟卷的米奇)。这在一定程度上取决于模型;例如,OpenAI 的 DALL-E 2 有一套更严格的过滤器。

为什么允许 NSFW(不适合工作场合观看)的图片存在,不顾风险且没有任何形式的水印(加利福尼亚州可能很快就会依法强制要求添加)来防止滥用?对于第一个问题,艾尔说这会扼杀“艺术自由”。

她补充道:“当被标记为 NSFW 时,我们确实允许网站上出现轻度的艺术裸体和成人主题,但不允许直接的色情内容。我们已在社区标准中尽力为用户‘划定界限’,让他们明白哪些是允许的,哪些是不允许的。”“我们为我们的社区感到自豪,我们是所有 AI 艺术的‘中心’。”

从我为数不多的搜索来看,NightCafe 似乎没有充斥着越界的不良内容。但我不禁注意到,大多数“性感”图片的主角都是女性——在这类平台上这是一种不幸的模式。

NightCafe 未来的走向如何

和许多在人工智能驱动的艺术生成领域的初创公司一样,NightCafe 似乎处于一种停滞状态。它正在上线新的模型,包括像 Stable Video Diffusion 这样的视频生成模型。但它并没有太大的突破——未言明的原因是,一项法庭裁决或法规就可能迫使 NightCafe 重新思考其整个业务。

不过,艾尔似乎认为 NightCafe 有发展潜力,不需要外部投资。

拉塞尔说:“在过去两年图像生成热潮期间,我们的大多数竞争对手都筹集了资金。几乎所有这些竞争对手过去或现在都在亏本提供图像生成服务以获取用户。他们不可能都成功;NightCafe 开创了人工智能与艺术的交叉领域,还倡导了这样一种理念,即利用先进技术进行创作应当人人都能实现。”

尽管这样的产品可能会带来丰厚的利润(先不考虑审核方面的障碍),但目前没有推出企业版 NightCafe 的计划。Elle 表示,重点仍将是基于最新的生成模型建立一个社区和“社交中心”。

她说:“该行业面临的一个挑战是,图像生成模型变得如此出色,很快就会被商品化。那到时候公司靠什么竞争呢?在 NightCafe,我们选择专注于成为顶级模型的聚合商,以提供最多样化和最先进的技术。”

我们将看看它从这里如何穿越波涛汹涌的水域。