Guardrails AI希望利用众包的方式解决GenAI模型的问题

Chat中文版

很容易让GenAI说出谎言和不实言辞。

在过去的一周里，微软和谷歌的聊天机器人在比赛开始前就宣布了超级碗的获胜者，这就提供了一个例子。然而，真正的问题是当GenAI产生有害的幻觉时，它会支持酷刑，强化种族和种族刻板印象，并以有说服力的方式写关于阴谋论的文章。

越来越多的供应商，从像Nvidia和Salesforce这样的老牌公司到像CalypsoAI这样的初创公司，都提供了一些产品，声称可以减少GenAI中不受欢迎的有毒内容。但是这些产品都是黑盒子，除非单独测试每个产品，否则无法知道这些抗幻觉的产品之间的比较情况，以及它们是否真正实现了所声称的功能。

夏利娅·拉吉帕尔将这视为一个重大问题，并创办了一家名为Guardrails AI的公司，试图解决这个问题。

“大多数机构……都在努力解决有关 AI 应用的负责任部署问题，并且难以确定什么是最佳和最高效的解决方案，” Rajpal 在电子邮件采访中告诉 TechCrunch。"他们常常在管理对其重要的一组风险时陷入重新发明轮子的困境。"

根据拉杰帕尔的观点，调查表明，复杂性以及由此带来的风险是阻碍组织接受GenAI的主要障碍。

英特尔子公司Cnvrg.io最近进行的一项调查发现，大约四分之一的公司在实施GenAI应用时都担心合规和隐私、可靠性、实施成本高和缺乏技术技能等问题。与此相对应的，风险管理软件提供商Riskonnect的一项独立调查显示，超过一半的高管担心员工根据GenAI工具提供的不准确信息做出决策。

Rajpal之前曾在自动驾驶初创公司Drive.ai工作，在苹果收购Drive.ai后，加入了苹果的特殊项目组。他与Diego Oppenheimer、Safeer Mohiuddin和Zayd Simjee共同创立了Guardrails。Oppenheimer曾领导过机器学习运营平台Algorithmia，而Mohiuddin和Simjee在AWS担任技术和工程领导职务。

在某种程度上，Guardrails所提供的并没有与市场上已有的产品有太大的区别。这家初创公司的平台充当了GenAI模型的封装器，具体而言是开源和专有的（例如OpenAI的GPT-4）文本生成模型，旨在使这些模型在表面上更可信、可靠和安全。

Chat中文版

然而，Guardrails与众不同之处在于其开放源代码的商业模式——该平台的代码库可以在GitHub上免费使用，并采用了众包的方法。

通过一个名为Guardrails Hub的市场，Guardrails允许开发人员提交名为"验证器"的模块化组件，用于检测GenAI模型的特定行为、合规性和性能指标。验证器可以被其他开发人员和Guardrails的客户部署、重新利用和复用，作为自定义GenAI模型调节解决方案的构建模块。

“通过这个Hub，我们的目标是创建一个开放的论坛，分享知识，并找到推动人工智能采用的最有效方式，同时也希望建立起一套可供任何组织采用的可重复利用的约束条件，” Rajpal说道。

Guardrails Hub中的验证器从基于规则的简单检查到检测和缓解模型中问题的算法不一而足。目前大约有50个验证器，其中包括幻觉和政策违规检测器、专有信息过滤器和不安全代码过滤器。

“大多数公司会对亵渎、可识别个人信息等进行广泛的一刀切检查，”Rajpal表示。“然而，对于一个特定的组织和团队来说，什么属于可接受使用是没有一个通用的定义的。有机构特定的风险需要跟踪，例如不同组织之间的通信政策是不同的。通过这个中心，我们使人们能够直接使用我们提供的解决方案，或者使用它们来获得一个强大的起点解决方案，进而为他们的特定需求进行进一步自定义。”

模型警示岗的中心点是一个有趣的想法。但我内心怀疑开发人员会不会愿意在一个没有任何形式的补偿承诺的平台上贡献自己的力量，尤其是一个刚起步的平台。

拉杰帕尔持乐观态度，他认为他们会采取行动，即使没有其他原因，也是为了获得认可——无私地帮助行业朝着“更安全”的GenAI发展。

“该平台允许开发者了解其他企业所遇到的风险类型以及他们采取的防护措施，用于解决和减轻这些风险，”她补充说。“验证器是这些防护措施的开源实施，组织可以将其应用于他们的使用案例。”

Guardrails AI最近进行了一次种子轮融资，由Zetta Venture Partners领投，Factory、Pear VC、Bloomberg Beta、Github Fund以及包括著名AI专家Ian Goodfellow在内的天使投资者参与，融资金额为750万美元。Rajpal表示，这笔资金将用于扩大Guardrails的团队规模，以及开展更多的开源项目。目前，Guardrails AI还没有为任何服务或软件收费。

她继续说道：“我们与许多企业、小型初创企业和个人开发者交谈，他们因为缺乏所需的保证和风险缓解能力而无法发布GenAI应用程序。这是一个在这个规模上尚未存在的新问题，因为ChatGPT和基础模型的出现。我们希望成为解决这个问题的人。”

推荐阅读

谷歌在巴黎的新人工智能中心表明谷歌对人工智能感到不安

今天上午，Google的首席执行官桑达尔·皮查伊在巴黎为人工智能专门的新中心举行了揭幕仪式。该中心位于巴黎谷歌总部附近一栋新装修的建筑内。预计将有约300名研究员和工程师在此工作。但如果你对谷歌在巴黎的动向留心观察，你可能会认为谷歌...。

2024-02-15438

Clarity筹集了1600万美元，通过检测来对抗深度伪造技术

关于泰勒·斯威夫特的假色情作品。加沙地带的逼真但虚构的图像。令人不安的深度伪造清单还有很多，而随着制作深度伪造工具变得越来越简单和便宜，大量虚假内容正以更快、更猛烈的速度涌现。根据最近的皮尤研究中心民意调查，约有三分之二的美国人（66%）表示他们…

2024-02-152964

我们测试了谷歌的Gemini聊天机器人——这是它的表现

Gemini，谷歌对OpenAI的ChatGPT和微软的Copilot的回应，已经面世了。它好用吗？虽然对于研究和生产力来说是一个可靠的选择，但它在明显的以及一些不太明显的地方都存在一些问题。上周，谷歌将其Bard聊天机器人重新命名为Gemini，并且Gemini与...（与同名的部分）混淆...

2024-02-152031

阿米拉希望为公司提供人工智能的保修

GenAI存在许多问题，特别是第三方GenAI。它会捏造事实、存在偏见和毒性，还可能违反版权规定。根据麻省理工学院斯隆管理评论和波士顿咨询集团最近的一项调查，超过55%的与AI相关的故障是由第三方AI工具导致的。

2024-02-152955

Kong的新开源AI Gateway使构建多LLM应用更加容易

API公司Kong今天推出了开源AI网关，它是现有API网关的扩展，允许开发人员和运维团队将他们的应用程序与一个或多个大型语言模型（LLM）集成，并通过一个单一API进行访问。此外，Kong还推出了几个专为人工智能设计的功能，包括智能提示工程...

2024-02-15496