原标题:这位数据科学家,认为算法导致了世界上更多的不公正 | TED 2017现场报道

谢若含

“ 我这边马上就要上TED演讲了,希望等会不要晕倒在舞台上,另一边他们还在卖我的书《数学毁灭性武器》”数据科学家Cathy O'Neil在登上今年的TED舞台以前,在Twitter上这样打趣自己。

但她这次的演讲主题很严肃,Cathy O'Neil想告诉人们那些看似有大量数据做支撑的算法得出的结果,其实并不客观。相反它背后是由人们的偏见所掌控的。但算法如今在我们生活中实在是太常见了,从你缴纳医保费用的多少到申请一份工作,背后可能都是算法在进行衡量。

Cathy O'Neil拿到哈佛大学数学系博士学位后,又在华尔街冲基金公司担任量化策略分析师多年,了解金融机构内部运作机制之后,Cathy O'Neil对基金模型大失所望。发生全球金融危机之后,她成为了“占领华尔街运动”的主要发起人之一,以此来反对大公司的贪婪与不公正。

在演讲中,Cathy O'Neil通过大量事例证明了由算法来得出的判断可能是错误的。她引述了《纽约时报》曾报道过一位教师的例子,在纽约考核教师的算法机制中,除了学生的学业表现,还要综合考虑上20-30种变量。最后这个算法对教师考评的结构让这所学校最优秀的老师,得到了最差的评价等级。不仅是在绩效考核领域,来自媒体调查机构Propublica的一份数据也显示,算法歧视体现在各个领域,包括预判犯罪、评估汽车保险费用等。

通过预测模型,左边的犯罪风险为高,右边为低。但事实并非如此

Cathy O'Neil还假设,如果Fox新闻决定通过算法来改变过去性虐待丑闻的负面形象,他们在制定这套算法时,首先需要数据来进行大量的训练。数据从哪儿来? 从过往这家公司20年来的招聘数据库里来。

Cathy O'Neil认为,这套算法依然会对女性产生歧视,因为这些用来训练算法的数据在以往的招聘中就一直存在偏见,它所得出的算法就不可能客观。

“算法并没有让事情变得更加公平。” O'Neil说。

在她的《数学毁灭性武器》(《Weapons of Math Destruction》)一书中也详细论述了大数据与机器模型的负面影响。总体来讲,O'Neil认为,这些模型对在社会中占劣势的人有负面的影响,同时让富裕的人过得更轻松;同时,得出这些模型的过程并不是透明的,这让人们难以理解并发现其中的问题。

O'Neil还告诉《好奇心日报》,在离开金融公司,转型为一名社会活动家之后,将关注点放到了影响公众的算法上。比如Google的图片识别技术为什么会把黑人识别成星星呢,这就是因为在这个算法的数据训练库当中,根本没有放入过黑人的相册进行测试。”

要如何解决这个问题呢?

O'Neil觉得不能指望市场来解决 “自由市场无法解决任何问题,因为人们对利益的追逐驱使算法变得不公正。”

她的建议是,让算法数据也能得到审计,审计内容包括检测数据公正性(分析用于构建算法的数据是否含有偏见)、界定对于结果成功的定义(确保算法支持的是一个不带任何偏见色彩的目标)、检查整体的准确度、控制算法长期影响,避免数据的反馈回路。

最后,O'Neil认为要靠政府监管者的力量确保这一切能够得到实施。

但她又补了一句 “我并不指望川普政府。”