谷歌的Gradient推出Send AI来帮助企业从复杂文件中提取数据
一家起步的荷兰初创公司希望帮助企业从大量复杂文件中提取数据,确保准确性和安全性至关重要,并且它刚刚获得了Google的Gradient Ventures的支持。
Send AI,即这家初创公司的名称,正在与诸如UiPath、Abbyy、Rossum和Kofax等文档处理领域的老牌企业竞争。他们提供一个可定制的平台,使公司能够根据自身独特的数据提取需求对AI模型进行优化。
例如,一家在高度监管的行业中运营的公司,如保险公司,很可能需要处理各种格式的数据,从PDF文件和纸质档案到用各种方向和背景“噪音”拍摄的手机照片。这些非标准的“非结构化”数据类型对于人类来说已经很棘手了,而完全依靠机器的方法可能会导致错误的索赔拒绝或报销,并且在行政方面带来很多麻烦。
实际上,通常的现成文件处理软件常常设计用于与多个行业交叉的常见文件类型,因此对于某些特定用例来说并不适用。相反,通过使用Send AI,公司可以训练一个计算机视觉模型来识别特定的文档,并使用单独的语言模型来提取和验证相关数据 - 如果有任何疑问,可以将人类纳入进来,通过网页界面控制和审核每个步骤。
“这种验证可以很简单,比如检查一个期望的数字是否真的是一个数字,或者更复杂地在数据库中查找一个注册号码以查看是否有匹配,” Send AI的创始人兼首席执行官汤姆·特伦特尔曼告诉TechCrunch。 “所有的不安全因素都将被报告进行人工审核。”
Send AI最早在2021年作为Autopilot在阿姆斯特丹成立,起初从一家大学毕业校友基金筹集了10万美元的小额投资,但随着业务的扩大,现在它在一轮种子融资中再次筹集了220万欧元(240万美元),由谷歌的Gradient Ventures和Keen Venture Partners共同领投,同时还有一些来自DeepMind等公司的天使投资者参与。
如何运作
企业可以通过API访问Send AI的基于云的软件,该软件通过电子邮件传送文档的数据。在接收后,Send AI会对文档进行视觉增强,然后将其发送给语言模型进行分类和提取。
在目标市场方面,特伦特尔曼表示该公司实质上主要瞄准大型企业,因为它们“最为苦恼于文件处理”,但事实上,任何处理大量文件的企业都可能会用到这项技术。
毋庸置疑,除了市场上已经存在的大量文件处理工具之外,Send AI还要面对一批基于强大新型语言模型(LLMs)构建服务的初创公司的竞争,如OpenAI使用GPT-X(ChatGPT的核心技术)所做的。然而,Trentelman承认这些产品在需要“主观良好”得分(如摘要或回答问题)的情况下表现出色,但如果需要在大量文档中保持高准确性,情况就不一样了。
"Trentelman表示:“使用这些技术,你迟早会遇到困难——大型通用LLM仍然不可预测、缓慢而昂贵。而在Send AI,我们允许客户自己构建解决方案。”
在背后,Send AI是建立在较小的开源模型上的,客户首先通过手工处理一小批文件来进行训练,然后在新的文件上重复此过程,并有人员在场进行更正。
在定价方面,Send AI采用基于信用的计费方式,即客户按处理步骤付费。 Trentelman说:“通过这种方式,我们可以区分处理50页PDF和处理单一文本片段的成本。”“我们的模型廉价、快速、可靠,因此我们可以按照每个客户的需求部署它们。这样,客户就能控制自己的数据和性能,这也是我们在受监管的行业(如健康保险和政府机构)中做得好的原因。”
控制
SendAI声称其技术将吸引高度管制的行业,因为它赋予客户对其数据的控制,尽管这是基于云的,这可能看起来是违反直觉的。然而,特伦特曼指出,OpenAI等公司的典型LLM是如何工作的,即如何将来自多个不同客户的训练数据混合到一个模型中,这可能会引发敏感数据泄露的潜在风险。这正是为什么我们看到了一大批承诺在LLM驱动的软件中保护私人数据的初创企业出现的原因。
通过为每个客户部署小型、隔离的开源转换模型,Send AI试图解决这些问题。
“我们使用各种方法完成工作——一开始它们并没有太多的优势,但一旦经过高质量数据的培训,它们就变得强大而且精确。” Trentelman说道。
因此,虽然模型和相关的训练数据仍存储在Send AI的云端,但使用隔离模型意味着它可以精确地确定数据所在的位置,并在请求时删除它。据特伦特尔曼表示,这足以使其成为其他供应商的“首选候选者”,并且可以说服注重数据隐私的公司,本地部署并不是他们唯一的选择。
“如今,越来越多受规管的公司允许供应商使用公共云,只要他们遵守一长串的规定,”特伦特尔曼说。“一开始,我们一直被问及能否部署本地设备,但最终除了一家公司外,其他所有公司都选择了我们的公共云解决方案。”
目前,Send AI正处于私人beta测试阶段,尽管它已经拥有一些令人印象深刻的客户,包括保险巨头安盛。该公司目前有一个由七人组成的团队,计划利用新的注资,在全面商业化推出之前将团队规模增加一倍。