谷歌的Gradient推出Send AI来帮助企业从复杂文件中提取数据

Chat中文版

一家起步的荷兰初创公司希望帮助企业从大量复杂文件中提取数据，确保准确性和安全性至关重要，并且它刚刚获得了Google的Gradient Ventures的支持。

Send AI，即这家初创公司的名称，正在与诸如UiPath、Abbyy、Rossum和Kofax等文档处理领域的老牌企业竞争。他们提供一个可定制的平台，使公司能够根据自身独特的数据提取需求对AI模型进行优化。

例如，一家在高度监管的行业中运营的公司，如保险公司，很可能需要处理各种格式的数据，从PDF文件和纸质档案到用各种方向和背景“噪音”拍摄的手机照片。这些非标准的“非结构化”数据类型对于人类来说已经很棘手了，而完全依靠机器的方法可能会导致错误的索赔拒绝或报销，并且在行政方面带来很多麻烦。

实际上，通常的现成文件处理软件常常设计用于与多个行业交叉的常见文件类型，因此对于某些特定用例来说并不适用。相反，通过使用Send AI，公司可以训练一个计算机视觉模型来识别特定的文档，并使用单独的语言模型来提取和验证相关数据 - 如果有任何疑问，可以将人类纳入进来，通过网页界面控制和审核每个步骤。

“这种验证可以很简单，比如检查一个期望的数字是否真的是一个数字，或者更复杂地在数据库中查找一个注册号码以查看是否有匹配，” Send AI的创始人兼首席执行官汤姆·特伦特尔曼告诉TechCrunch。 “所有的不安全因素都将被报告进行人工审核。”

Send AI最早在2021年作为Autopilot在阿姆斯特丹成立，起初从一家大学毕业校友基金筹集了10万美元的小额投资，但随着业务的扩大，现在它在一轮种子融资中再次筹集了220万欧元（240万美元），由谷歌的Gradient Ventures和Keen Venture Partners共同领投，同时还有一些来自DeepMind等公司的天使投资者参与。

如何运作

企业可以通过API访问Send AI的基于云的软件，该软件通过电子邮件传送文档的数据。在接收后，Send AI会对文档进行视觉增强，然后将其发送给语言模型进行分类和提取。

在目标市场方面，特伦特尔曼表示该公司实质上主要瞄准大型企业，因为它们“最为苦恼于文件处理”，但事实上，任何处理大量文件的企业都可能会用到这项技术。

Chat中文版

毋庸置疑，除了市场上已经存在的大量文件处理工具之外，Send AI还要面对一批基于强大新型语言模型（LLMs）构建服务的初创公司的竞争，如OpenAI使用GPT-X（ChatGPT的核心技术）所做的。然而，Trentelman承认这些产品在需要“主观良好”得分（如摘要或回答问题）的情况下表现出色，但如果需要在大量文档中保持高准确性，情况就不一样了。

"Trentelman表示：“使用这些技术，你迟早会遇到困难——大型通用LLM仍然不可预测、缓慢而昂贵。而在Send AI，我们允许客户自己构建解决方案。”

在背后，Send AI是建立在较小的开源模型上的，客户首先通过手工处理一小批文件来进行训练，然后在新的文件上重复此过程，并有人员在场进行更正。

在定价方面，Send AI采用基于信用的计费方式，即客户按处理步骤付费。 Trentelman说：“通过这种方式，我们可以区分处理50页PDF和处理单一文本片段的成本。”“我们的模型廉价、快速、可靠，因此我们可以按照每个客户的需求部署它们。这样，客户就能控制自己的数据和性能，这也是我们在受监管的行业（如健康保险和政府机构）中做得好的原因。”

控制

SendAI声称其技术将吸引高度管制的行业，因为它赋予客户对其数据的控制，尽管这是基于云的，这可能看起来是违反直觉的。然而，特伦特曼指出，OpenAI等公司的典型LLM是如何工作的，即如何将来自多个不同客户的训练数据混合到一个模型中，这可能会引发敏感数据泄露的潜在风险。这正是为什么我们看到了一大批承诺在LLM驱动的软件中保护私人数据的初创企业出现的原因。

通过为每个客户部署小型、隔离的开源转换模型，Send AI试图解决这些问题。

“我们使用各种方法完成工作——一开始它们并没有太多的优势，但一旦经过高质量数据的培训，它们就变得强大而且精确。” Trentelman说道。

因此，虽然模型和相关的训练数据仍存储在Send AI的云端，但使用隔离模型意味着它可以精确地确定数据所在的位置，并在请求时删除它。据特伦特尔曼表示，这足以使其成为其他供应商的“首选候选者”，并且可以说服注重数据隐私的公司，本地部署并不是他们唯一的选择。

“如今，越来越多受规管的公司允许供应商使用公共云，只要他们遵守一长串的规定，”特伦特尔曼说。“一开始，我们一直被问及能否部署本地设备，但最终除了一家公司外，其他所有公司都选择了我们的公共云解决方案。”

目前，Send AI正处于私人beta测试阶段，尽管它已经拥有一些令人印象深刻的客户，包括保险巨头安盛。该公司目前有一个由七人组成的团队，计划利用新的注资，在全面商业化推出之前将团队规模增加一倍。

推荐阅读

Artisse AI为其“更真实”AI照片应用筹集了670万美元资金

Artisse是许多AI照片生成应用之一，它让用户通过上传的自拍照片与提示文字相结合生成自己的照片。在AI自拍热潮之后，Artisse获得了670万美元的种子轮融资。与市场上其他类似的应用一样，Artisse的用户上传自己的照片来训练AI模型，然后使用该应用生成照片。

2024-01-23850

Dusty推出了一款全新版本的施工布局机器人

当Dusty's FieldPrinter于2019年推出时，为建筑自动化领域增添了一种巧妙的新维度。这款自主移动机器人通过在工地的地板上绘制粉笔勾线将蓝图呈现在现实世界中，从而消除了大部分不必要的猜测。在这个你真的不想猜测的工作中，该公司为施工带来了便利。

2024-01-23537

谷歌浏览器（Google Chrome）获得了一些人工智能功能，包括写作助手、主题创作和标签整理器

谷歌的Chrome浏览器在最新版本中将获得人工智能技术的注入。该公司今日宣布，很快将为Mac和Windows的Chrome添加三个新的由人工智能提供支持的功能，包括智能整理标签的方式，自定义主题，以及在网络上写东西时获取帮助。

2024-01-232188

Kin.art发布免费工具，防止GenAI模型训练使用艺术品

人工智能（AI）模型如Midjourney和OpenAI的DALL-E 3，尤其是文本到图像 AI 模型，能够产生令人惊叹的效果。从写实主义到立体派，图像生成模型能够将几乎任何简短或详细的描述转化为艺术作品，好似是从艺术家的画架上涌现出来的。然而问题是，这些模型中的许多，如果不是大多数，

2024-01-231627

谷歌的新代号为Gemini的对话工具帮助广告主快速构建搜索广告活动

谷歌今天宣布，其多模态大型语言模型系列Gemini现已为Google Ads平台提供对话体验的动力。通过此新功能，广告客户能够更轻松地快速构建和扩大搜索广告活动。这种对话体验旨在通过一种基于聊天的工具帮助构建搜索广告活动。

2024-01-23963