Cogito Tech是用于人工智能开发的数据标注领域值得信赖的领先者,它正在率先推广一种更符合道德的人工智能(AI)、机器学习(ML)开发和应用实践方法。近期Cogito发布了一个名为DataSum的“营养成分表”风格的人工智能训练数据框架,以此向全球人工智能供应商发出呼吁。Cogito Tech向行业提出挑战,要求人类更加努力,呼吁采取更人道的劳动实践和道德数据管理策略,从而推动人工智能的进步。

打开网易新闻 查看精彩图片

Cogito旨在为数据生命周期提供最高级别的透明度和道德考量。通过DataSum,该公司鼓励利益相关者利用该框架,就数据集选择、劳动力条件和数据标注技术堆栈做出明智的决定。新推出的DataSum旨在使这些承诺透明且可衡量,作为整个行业的人工智能供应链管理组件和基准。因此,这种详细程度允许用户对他们使用的人工智能做出更明智和合乎道德的决定。

Cogito Tech首席执行官Rohan Agrawal表示:“随着人工智能领域的不断创新,对值得信赖和全面的供应链管理框架的需求变得越来越重要。”“DataSum是我们解决这一迫切需求的答案。从个性化医疗、全面财务规划到法律见解,利用人工智能技术在各个领域彻底改变消费者互动的潜力至关重要。通过利用我们行业的集体专业知识,有机会建立一个新的标准——一个为全球消费者增强和保障人工智能体验的标准。”

数据标注中的“劳动剥削”

尽管人工智能的采用和创新正在飙升,但人工智能背后的大部分劳动力都在低工资和不利的条件下工作。例如,肯尼亚、菲律宾、印度和其他地区的人类数据标注员通常仅有每小时工作不到2美元收入。

Cogito Tech高级副总裁Matthew McMullen说:“人工智能不是凭空出现。其依赖于人工制作的数据来获得适当的上下文和准确性,但数据标注者的作用被低估了。”“如果没有熟练的人类专业知识来塑造和完善数据,人工智能算法将越来越不准确。人工智能行业是时候通过改善工作条件和支付更合理工资来认识到数据标注者的贡献了。”

例如,RLHF(人工反馈强化学习)对机器学习至关重要。然而,这些执行关键数据标注任务的临时工人收入较低。牛津大学互联网研究所最近发布的一份关于在线外包的报告称,接受调查的组织都没有达到公平劳动原则(公平薪酬、公平条件、公平合同、公平管理和公平代表)的最低标准。报告还显示,工人平均每小时收入2.15美元,近27%的工作时间是无偿任务。

劳动力合同与职业流动

此外,推进人工智能技术的劳动者经常发现自己陷入了严格的合同协议中,而这些协议是劳动者被迫签署的。这些合同通常授予数据供应商对劳动者职业身份的独家所有权。

“这些工人不仅是车轮上的齿轮,而且是重要的贡献者。这些工人对合同协议失去控制,使他们无法谈判获得更好的条件和更高的薪酬机会。现有的制度往往将他们边缘化,阻碍了他们的职业流动。呼吁基于经验的公平工资,加上真正的技能发展机会。“McMullen说:“这就是我们在Cogito正在努力实现的目标。”

国际劳工组织和劳工组织的《三方宣言》等国际准则和新兴标准在倡导工人权利和公平工资方面取得了长足进步。这些指导方针呼吁包括数据供应商在内的企业实施道德规范,确保员工得到公平的薪酬,但这些数据员工仍然面临着严峻的挑战。

道德数据来源的必要性

除了合理对待劳动力外,Cogito还呼吁数据供应商在采购数据集时采用更高的标准。随着人工智能的发展,保护知识产权越来越受到关注,Cogito呼吁人工智能供应商致力于在所有行业进行合乎道德的数据采购。

有道德来源的数据包括避免将专有数据和受版权保护的材料作为数据标注的一部分。此外,使用来自其他系统的数据可能会引入偏差,突出了识别数据来源的必要性以及机器生成数据的潜在含义。

打开网易新闻 查看精彩图片

Cogito与DataSum结合了“人工智能供应链管理”方法,坚持通过各种转换从数据源跟踪数据的道德含义。

McMullen说:“人工智能具有惊人的能力,但尽管人工智能可以模仿人类的辨别力、思维和过程,但它的性能取决于它接收到的数据的质量。”“大型语言模型(LLM)可能会生成看似真实的信息,但当面对欺骗性的输入时,这种信息可能会崩溃,这表明人工智能缺乏真实的认知,并强调了人类干预对其训练的重要性。”

“如果人工智能要推动人类进步,那么我们需要平衡人工智能的潜力与伦理。我们需要改变这种说法,承认人工智能不仅仅是尖端算法,而是人类奉献精神和独创性的结果。人工智能行业必须制定道德准则,确保员工的专业知识得到适当补偿,数据集的来源也要负责任。”

McMullen强调,参与人工智能供应商的企业在倡导劳工标准、道德采购和可持续性方面发挥着关键作用。

打开网易新闻 查看精彩图片

自2011年以来,Cogito Tech已成为领先的人工智能训练数据公司,提供包括计算机视觉(CV)、自然语言处理(NLP)、内容审核、数据和文档处理在内的人工智能劳动力解决方案。