实验发现,人工智能能提升个人创造力,但会降低集体创造力。
一项新的研究对人工智能能否在创意任务中成为自动的助手进行了调查,结果喜忧参半:它似乎帮助那些天生创造力较弱的人写出了更具原创性的故事,但却削弱了整个群体的创造力。随着人工智能工具对创意工作产生影响,这种权衡可能会越来越常见。
这项研究由伦敦大学学院的阿尼尔·多希(Anil Doshi)和埃克塞特大学的奥利弗·豪泽(Oliver Hauser)分别进行,发表在《科学进展》杂志上。虽然由于其关注的是短篇小说,必然存在局限性,但它似乎证实了许多人所表达的感受:人工智能可能有所帮助,但在创造性努力方面最终无法提供真正全新的东西。
豪泽在一封电子邮件中告诉 TechCrunch:“我们的研究是对一个重大问题的早期看法,即大型语言模型和更广泛的生成式人工智能将如何影响人类活动,包括创造力。虽然这项技术在媒体和更广泛的创造力领域具有产生重大影响的巨大潜力(而且,毫无疑问,也存在巨大的炒作),但重要的是要对人工智能进行严格评估——而不是仅仅在假设它会产生积极结果的情况下就广泛应用。”
该实验让数百人撰写非常短的故事(约 8 个句子),主题不限,但要适合广大读者。一组人只是直接写作;第二组有机会就一个故事的想法向 GPT - 4 咨询几句(他们可以根据自己的喜好或多或少地使用);第三组最多可以获得五个这样的故事开头。
一旦故事写好,它们就会由作者本人和对生成式人工智能的介入一无所知的另一组人进行评估。这些人根据新颖性、实用性(即出版的可能性)和情感享受程度对这些故事进行评分。
创造力低,收益高……创造力高,没收益
在撰写故事之前,参与者还完成了一项单词生成任务,该任务可作为创造力的替代指标。创造力是一个无法直接衡量的概念,但在这种情况下,至少可以大致评估一个人在写作方面的创造力(不带评判!并非每个人都是天生或训练有素的作家)。
豪泽写道:“用任何方法来捕捉像创造力这样丰富和复杂的东西似乎都充满了复杂性。然而,关于人类创造力有大量的研究,对于如何在一项测量中最好地捕捉创造力的概念,存在着激烈的争论。”
他们表示,他们的方法在学术界被广泛使用,并且在其他研究中有充分的记录。
研究人员发现,创造力指标较低的人在其故事的评估中得分最低,这可以说验证了该方法。他们还发现,当有机会使用生成的故事创意时(值得注意的是,在整个实验中绝大多数人都这样做了),这些人的进步最大。
创造力得分低且只是自行创作的人的故事,在写作质量、趣味性和新颖性方面的可靠评分都低于其他人。若给予一个由人工智能生成的想法,他们在各项指标上的得分会更高。若有五个可供选择,他们的得分则会更高。
对于那些在写作的创意方面苦苦挣扎的人(至少在这种背景和定义下),人工智能助手似乎确实提高了他们的工作质量。这可能会引起许多不擅长写作的人的共鸣,语言模型说“嘿,试试这个”,正是他们完成一个段落或开启新章节所需要的提示。
但是那些在创造力指标上得分高的人情况如何呢?他们的写作水平有没有达到新的高度?遗憾的是,并没有。事实上,这些参与者几乎没有看到任何好处,甚至(尽管差距很小,而且可以说不显著)得到了更差的评分。似乎那些有创造力的人在完全没有人工智能帮助的情况下反而创作出了他们的最佳作品。
人们可以设想出许多造成这种情况的原因,但这些数字确实表明,在这种情况下,人工智能对具有天生创造力的作家产生了零到负面的影响。
“Flattened”常见释义为“被压扁的;变平的”。例如:“The box was flattened during transportation. ”(这个盒子在运输过程中被压扁了。)
但那并不是研究人员所担心的部分。
除了参与者对故事的主观评价之外,研究人员还进行了一些自己的分析。他们使用 OpenAI 的嵌入 API 来评估每个故事与其所在类别(即仅人类创作、一个 AI 选项或五个 AI 选项)中的其他故事的相似程度。
他们发现,使用生成式人工智能会导致生成的故事更接近其所属类别的平均值。换句话说,作为一个群体,它们更加相似,变化更少。总体差异在 9% - 10% 的范围内,所以并不是说这些故事彼此完全相同。而且谁知道呢,这种相似性也许是因为不太熟练的作者完成一个建议的故事,而不是更有创造力的作者从零开始创作一个故事所导致的。
然而,这一发现足以在结论中给出警示说明,由于我无法对其进行精简,所以将其完整引述如下:
它呼应了视觉艺术和网络内容中的担忧,即如果人工智能催生更多的人工智能,而它所训练的数据只是更多自身的内容,最终可能陷入一个自我延续的平庸循环。随着生成式人工智能开始逐渐渗透到每一种媒介中,正是这样的研究对那些关于无限创造力或人工智能生成的电影和歌曲的新时代的主张起到了制衡作用。
豪泽和多希承认,他们的工作仅仅是个开端——这个领域是全新的,包括他们自己的研究在内,每项研究都存在局限性。
豪泽写道:“我们预计未来的研究将沿着多条路径展开。例如,在实际应用中生成式人工智能的实现方式将与我们的受控环境有很大不同。理想情况下,我们的研究有助于指导这项技术以及我们与它的交互方式,以确保无论是在写作、艺术还是音乐方面,创意想法能持续保持多样性。”