Anthropic的Claude添加了一个快速改进您的人工智能APP的提示性游乐场

AI7号2024-07-102175

Chat中文镜像

去年在人工智能行业中,快速工程变成了一个炙手可热的工作,但现在Anthropic公司似乎正在开发工具,至少部分自动化这一过程。

Anthropic在周二发布了几项新功能,以帮助开发者利用该初创公司的语言模型Claude创建更有用的应用程序。开发者现在可以使用Claude 3.5 Sonnet来生成、测试和评估提示,利用提示工程技术来创建更好的输入,并改善Claude在专业任务中的答案。这些信息来自该公司的一篇博客文章。

语言模型在执行任务时通常会比较宽容,但有时候微调提示的措辞可能会大幅改善结果。通常情况下,你得自己摸索出最佳措辞,或者雇佣一个专门的提示工程师来完成这项工作,但这项新功能提供了快速反馈,可能会让你更容易找到改进的方法。

以下是翻译好的简体中文版本: 这些功能集成在人类控制台的一个新的“评估”选项卡下。控制台是这家初创公司为开发人员建立的测试厨房,旨在吸引希望利用Claude构建产品的企业。其中一个功能,在五月份揭示,是Anthropic内置的提示生成器;它接受任务的简短描述,并构建一个更长、更详细的提示,利用Anthropic独有的提示工程技术。虽然Anthropic的工具可能不会完全取代提示工程师,但公司表示这将帮助新用户,并为经验丰富的提示工程师节省时间。

在Evaluate中,开发者可以测试他们的AI应用在各种场景中的提示效果。开发者可以上传真实世界的例子到测试套件,或者让克劳德生成一系列AI生成的测试用例。然后,开发者可以并排比较各种提示的效果,并且按照五分制对样本答案进行评分。

在Anthropic的博文中举了一个例子,一位开发人员发现他们的应用在多个测试案例中给出的答案太短了。开发人员成功调整了提示中的一行代码,使答案变得更长,并同时应用到所有的测试案例中。这可以节省开发人员大量的时间和精力,尤其是那些缺乏提示工程经验的开发人员。

Anthropic 的首席执行官兼联合创始人达里奥·阿莫代在今年早些时候的 Google Cloud Next 访谈中表示,快速的工程调整是促使企业普遍采用生成式人工智能的最重要因素之一。阿莫代说:“听起来很简单,但是只需与一个快速工程调整师花上30分钟,往往就能让一个应用程序在之前无法运行的情况下正常工作。”