“数据工作者详细揭露科技行业在DAIR报告中的剥削行为”

AI7号2024-07-092261

Chat中文镜像

数据工作的基础劳动,如内容审核和标注,往往被系统性地隐藏起来,而从中受益的人却很少看到这些劳动的成果。一个新项目将全球数据工作者的生活经历放在聚光灯下,首次展示了科技工作在国外的成本和机遇。

许多乏味、辛苦或者对心理有害的任务被外包到较贫困的国家,那里的工人乐意接受只有美国或欧洲工资一小部分的工作。这种劳动市场包括其他“枯燥、肮脏或危险”的工作,比如电子废料“回收”和拆船。在中度或者注释工作中的条件可能不至于要了你的命或导致癌症,但这并不代表它们安全,更不用说是愉快或有价值的。

数据工作者调查是AI伦理研究组织DAIR与柏林工业大学合作的项目,名义上模仿了19世纪末马克思的工作,通过“集体制作和政治可操作的”报告来识别劳动条件。

所有的报告都可以免费获取,并且是在今天举行的在线活动中发布的,项目负责人在活动中对此进行了讨论。

人工智能应用的不断扩大范围,必然建立在人类专业知识之上,而这种专业知识至今以来以公司能够提供的最低价格购买,而不会引发公关问题。当你举报一个帖子时,它不会说“太好了,我们会把这个发给叙利亚的一个人,他只会拿到3分钱来处理它。”但举报的数量(以及值得举报的内容)如此之多,以至于除了大规模外包到廉价劳动力市场以外,对涉及的公司来说真的没有其他解决方案。

浏览这些报告,它们大多是轶事性的,这是有意为之的。这些报告更像是系统人类学观察的记录,而非定量分析的水平。

将这段英文翻译成简体中文如下: 像这样的经历往往难以量化实际代价 — 最终得出的统计数据往往是公司喜欢吹嘘的那种:比当地其他公司更高的工资、创造的就业岗位、向客户传递的节省成本。很少有像适度工作人员因噩梦失眠或猖獗的药物依赖这样的问题被提及,更别提被测量和呈现出来了。

读一下Fasica Berhane Gebrekidan关于肯尼亚数据工作者在抗击心理健康和药物问题方面的报道(完整的PDF文件在这里)。

她和她的同事为Sama工作,这家公司标榜自己是一个更加道德的数据工作流水线,但实际工作情况却是令人难以忍受的苦难和当地办公室的支持不足,这是真实的工作描述。

根据报告,他们被招募来处理本地语言和方言的工单(即被标记的内容),他们不断地接触到暴力、血腥、性虐待、仇恨言论等内容,他们必须快速查看并迅速采取“行动”,以免表现低于预期水平而被扣工资。对于一些人来说,这意味着每分钟超过一个工单,即他们每天至少要查看大约500个这样的内容。(如果你想知道AI的位置在哪里——它们很可能提供了培训数据。)

“这绝对是压垮人心的。我看到了人们无法想象的最糟糕的事情。我担心这份工作会让我终身心灵受伤,”在接受采访的承包商之一Rahel Gebrekirkos说道。

支持人员“装备不足、不专业且资质不足”,而管理员经常依赖毒品来应对,并抱怨有侵入性思维、抑郁和其他问题。

我们之前听过类似的事情,但是仍然很重要知道这种事情依然在发生。有一些关于这种情况的报告,但也有更加个人化的故事或者采取不同的形式。

例如,叶瑟尔·尤素夫·阿尔雷斯是叙利亚的一名数据标注员,为了支付自己的高等教育而工作。他和室友一起从事视觉标注任务,例如解析文字图像,如他所指出的,这些图像通常定义不清,客户的要求也让人沮丧。

他选择用一部短片记录他的工作,这部影片值得你花八分钟的时间观看。

像亚瑟这样的工人通常被隐藏在许多组织层面之后,充当分包商的分包商,以便在出现问题或诉讼时责任线被模糊化。

DAIR和柏林工业大学的米拉格罗斯·米切利(Milagros Miceli)是该项目的负责人之一,她告诉我他们并没有看到报告中所指的公司有任何评论或变化,但现在还为时过早。但是结果看起来足够强大,让他们继续下去:“我们计划与第二批数据工作者继续这项工作,他们很可能来自巴西、芬兰、中国和印度。”

毫无疑问,有些人可能会因为这些报道的特性而质疑它们的真实性,那就是它们具有轶事性质。然而,虽然用统计数据容易撒谎,但轶事总是至少包含一些真实性,因为这些故事是直接来自于源头。即使这些问题只发生在肯尼亚、叙利亚或委内瑞拉的少数几位主持人身上,他们的言论也应该引起依赖他们的所有人的关注,而这几乎包括了每一个人。