如何通过区块链提高数据透明度并应对数据偏见
1203
数据偏差在人工智能中的影响已得到充分证明,并且随着人工智能和机器学习算法越来越深入社会的各个角落,人工智能公司正在寻找新方法来确保他们开发的算法不会继承人为偏差。旨在减少数据偏差的人工智能和机器学习空间中的新参与者之一是初创厂商Unbiased公司。Unbiased公司已在活跃的区块链平台Telos上启动了一个新的数据市场,希望为客户提供用于数据科学和人工智能的去中心化、隐私优先的工具和应用程序。
预计在未来十年中,全球人工智能市场将继续快速增长,到2027年将达到约2660亿美元。在未来四年内,全球在人工智能系统和相关组件上的支出预计将翻番,大约达到根据IDC公司的数据,到2024年将达到1100亿美元。在越来越多的行业中,人工智能算法的迅速采用导致人们对人工智能系统的透明性、隐私性、公平性和代表性的担忧日益增加。
通过透明度减少偏差
根据CapGemini研究院最近发布的题为“人工智能和道德难题:组织如何构建符合道德规范的人工智能系统并获得信任”的报告,人工智能的道德使用已成为各方面IT领导者关注的主要问题。现在,大多数IT领导者对人工智能系统的潜在滥用表示关注。10个IT组织中大约有9个表示,他们知道至少有一个事件是由于应用人工智能系统而造成道德问题。大约三分之二的IT高管表示,他们意识到人工智能系统中可能存在的歧视性偏见,并且大约一半的IT组织都有旨在推动人工智能发展的道德宪章,而在2019年只有5%的IT公司。
尽管关于如何使人工智能算法更公平的研究仍在继续,但许多伦理学家和人工智能专家将重点放在用于训练人工智能的数据上。随着人工智能算法变得越来越普遍和标准化,重点已转移到获取训练模型所需的数据。
减少人工智能算法中的数据偏差的方法有很多种。一些技术涉及在模型训练时对模型或训练数据进行调整。这些技术是“处理中”偏差校正技术。这包括使用对抗训练技术,在这种情况下,可以通过惩罚模型进行涉及所涉及特征的预测的能力来控制某些敏感特征/变量(例如性别或种族)。在尝试最小化模型误差的同时完成此操作。相反,专注于从数据集中消除偏差是一种预处理技术。机器学习模型的训练数据通常是手动标记的,而区块链的应用可以帮助公司跟踪其数据的标记过程,以确保其数据集具有代表性。
Unbiased公司正在寻求区块链在数据集和数据市场中营造一种透明文化。用于生成人工智能系统和机器学习算法的数据集的大多数工具都是集中式的,因此,它们通常缺乏透明度。Unbiased公司旨在利用区块链的性质来记录其数据市场中发生的动作,包括数据交换,任务和项目等式以及工人的贡献。目标是Telos区块链的分散性质有助于提高透明度,使用户可以获取有关其数据科学性质的关键信息。用户将能够验证其数据集并确定是否已对某些道德原则(例如公平和隐私)进行了注释。
Telos区块链的首席架构师认为,人工智能/机器学习与区块链的交叉可以带来变革性的数据处理新方法。正如AIthority引用Horn的话:“无偏见将向这些行业展示如何在诸如Telos之类的高性能,免费的区块链上记录数据,如何在其产品中增加透明度、不变性、小额支付和治理,以造福所有利益相关者。”
除了训练数据的透明度之外,一些科学家和研究人员还要求在算法,模型和代码方面增加透明度。一个国际科学家团队呼吁科学期刊让计算机科学研究人员达到更高的透明度标准。研究人员认为,关于人工智能模型和代码的更高透明度不仅有助于研究的可重复性,还有助于研究小组之间的合作。许多科学研究无法复制,而对于以人工智能为重点的研究却没有关键材料,这是一个更大的问题。将来甚至可以利用区块链来改善人工智能领域研究的跟踪和评估。