第一届网络社会年会主题报告 | 全喜卿：以同质性治理—

第一届网络社会年会时间：2016年11月14日上午地点：中国美术学院象山校区水岸山居会议室讲者：全喜卿（Wendy Chun）布朗大学现代文化与媒体专业教授译/卢睿洋校译/黄孙权

各位早安，非常感谢主办方邀请我参加第一届网络社会年会，非常振奋，我希望能和大家分享我正在做的项目。我现在正在写一本书，关于一些列名为数据歧视（discriminating data）的算法。数据歧视研究力图囊括人文领域、艺术、计算机科学、社会学等，来发展批判性的算法研究。我将简明扼要地把精髓告诉大家：通过网络，尤其是网络科学，我们现在所经历的是身份政治的激增，是范畴的激增，比如种族、性别差异、阶级、性存在，它们由于关联（correlation）和代理服务器而繁殖，这些事情通过最近的美国大选变得十分明显了。重点是，我们绝非处于后种族、后性别状态中，而这种状态是奥巴马当选时美国为之欢庆的东西。举个简单的例子，我们来看看邮政编码分析。这是对我居住的波士顿南瑞区的邮政编码分析。

邮政编码正在被用来确定越来越多的事情，比如你将支付多少汽车保险。有很多研究将邮政编码与几乎所有事情关联起来，从肥胖问题到犯罪问题。你能看到，在这个区生活的主要群体被称为“笔记本电脑与拿铁咖啡”，这些范畴看似无害，实则不然。在这里你能看到两个群体鲜明的区分。很多人指出，这些范畴的作用是划清种族、性别差异、性存在的范畴，而某些情况下，这样做在美国其实是非法的。更要紧的是，这些范畴是一种身份交集的代理服务器，尤其是种族与阶层的交集。如果你注意“西班牙语居民区”和“美国梦想家”这两个范畴，在种族方面它们几乎一致，但它们的阶层流动性却有细微差别，而这在分析和整合它们时是很重要的。这些范畴的危害在于，它们似乎只是描述，但实际上却是在规定，它们宣称只是发现了区隔，实际上却是在建立区隔。美国银行会基于邮政编码分析来决定是否给某人贷款。美国的警方预算越来越吃紧，所以他们基于邮政编码一类的东西来做预测从而决定警力资源分配。凯西·奥尼尔(Cathy O' Neil)在她的著作《数学杀伤性武器》(Weapons of Math Destruction)中非常出色的描述了这些问题。她先前是一名数学教授，之后转为量化数据科学家，她参加过占领运动，而在这本出色的著作中，她勾勒了大数据算法如何延续着不平等。她非常强调透明度，而这些算法最有害的地方正是不透明，你根本不知道你是如何被判别的。所以我们需要更多透明度，才可能干预这些算法，理解我们与它们的关系。她非常强调透明度，正如利奥塔（ Jean Francois Lyotard）在许多年前就指出的：“这些算法事关效率而非正义”。透明度很重要，但还不够，我希望大家思考一些略为不同的东西，即物质层的区隔面与网络层面的区隔之间怪异的反馈循环。如果说网络制造了回音室效应（echo-chamber），部分原因是它建立在美国的居住隔离模式之上。它的基本假设是，物以类聚人以群分。所以在网络科学的核心处是同质性（homophily），也就是一种我爱和我相同者的观念。这是网络科学的基本准则。所以，我的问题是，如果我们重新思考关联性，如果我们替换同质性，如果我们破坏同质性，如果我们拥抱自己在这场戏剧中的角色（这场戏剧被苍白地称为“大数据”）如果我们运用不同的网络，如果我们创造新的剧本，而非仅仅扮演“笔记本电脑和拿铁咖啡”，情况会有什么不同？

第一部分要谈“机器学习和洗钱”。最近告示牌（PinBoard）发布了如下推文“机器学习就像偏颇的洗钱”，被转发了上千次。之所以如此，是因为它似乎一语道破了不断增长的对机器学习和算法的伦理与所谓中立的怀疑。来看看最近脸书出的乱子，它最近出人意料地解雇了所有编辑，替换成算法编辑，《卫报》评论说，算法开始发疯。在几分钟内，就出现了两个假的头条故事新闻，它说保守派主持人凯利（ Meghan Kelly）（她为非常保守的新闻频道福克斯新闻工作）被福克斯解雇，据说因为她要支持了希拉里。第二个热点故事是件真事，一名男子用麦当劳的三明治自慰的视频流传在脸书上，脸书着力审查喂奶的图片，但却让这个视频蔓延开来。在当周，还出现对犯罪预测的指责。尤其是民权组织联盟发表声明谴责这种技术。这些组织说，问题在于内嵌在这些系统中的犯罪数据，它是非常不完全的，而且容易被种族偏见所操作或制造麻烦。这只是两个例子，其他的例子中还包括哈佛大学研究者的著名案例，在谷歌上搜索听起来像黑人的名字，就有25%以上的几率搜到有关犯罪记录的广告。美国法庭用于判断某人可能是惯犯的软件以及有些法庭用于决定一个罪犯是否假释或判刑多久的系统，都对少数族裔抱有偏见。这些例子综合起来，问题似乎在于“坏数据”。所以，据说我们需要的是更洁净的数据，需要清除了种族偏见的犯罪数据，数据库中需要有更多黑人民谣，我们的技术工业需要更多样。换言之，问题仍旧是数字分隔（digital divide）。虽然缺乏多样性的确是技术工业的一个问题，但解决之道并非所谓更好的数据，毕竟开发这些程序就是要解决政治、种族偏见。脸书之所以解雇了它的人类编辑，是因为它被指控对保守新闻势力有偏见。之所以转向机器学习，因为人们以为，假如我们运用了正确的技术，我们的政治问题就会消失，某种意义上，科技可以解决政治。这种观念正是这些系统的驱动力。所以，许多分析人士指出，问题不仅仅在于纳入数据或排除数据，而是差异如何被隐秘地编码进这些系统中。通过使受保护的个人可识别信息明晰化，大数据威胁着隐私保护。所以如今歧视的行为并不需要由某个组织主动做出。来看看芝加哥警方的头号名单，为了对付不断增多的杀人犯，芝加哥警方运用社交网络分析，得出了一份近420人的名单，这些人有可能杀人或被杀。当你掌握了这些，你就可以去找到他们说“你处在被谋杀的威胁中，赶快离开这里”，这种做法像极了一部叫《疑犯追凶》（Persons of Interest）的美剧。估计芝加哥警察是电视剧看多了。这张头号名单揭示的重要问题是，它并非基于你的行为，而是基于你所认识的人的行为。它实际上基于人们的关系串，基于你所引用的人。所以，由于你的朋友和朋友的行为，你成了嫌疑犯。所以种族并非被特别考虑在内的因素，因为它已经内在于社交网络范畴中。在众多研究中一项针对推特的研究揭示出，基于你点的赞、你粉的人和粉你的人，你的年龄、你的政治倾向一类的事情是非常容易推测出的。在网络分析中最可预测的是双向关系。所以，在网络的区域中，时时刻刻你其实都被捕捉。通过你的邻居，通过为你点赞的人，即便你自己什么都没说，你也被捕捉了；即便你什么都没做，你也已经被记录在案了。这是因为，如我在《更新到原样：习惯了的新媒体（Updating to Remain the Same）》一书中所说，你的历史已经不再属于你，你的身体不再是单一的，不再以皮肤为界，而是拓展到了那些为你点赞的人的范围里。你的身体通过你的行为与他人相连，连来连去我们成了奇美拉怪兽。你的行为再也不是单独的，而是症状性的。所以我越发认为大数据是精神分析的私生子：在大数据的世界中，没有事故、没有口误，所有行为都是症状性的，所有行为都揭示出更大的所谓无意识图式。精神分析的重点是改变患者，而网络科学也是通过各种发现来改变你的行为，虽然它没有明说。但网络科学为自己辩护的方式是：“我们仅仅提供人们所需”。所以大数据的所作所为是发掘人们的需求。但这些算法起到了延长它所发现的行为和歧视的作用。所以它们不仅仅是在描述，也是在规定，换言之，它们是述行性的（performative）。正如阿格雷（Philip E. Agre)

No comments yet

Institute of Network Society

第一届网络社会年会主题报告 | 全喜卿：以同质性治理——作为区隔的网络科学

Institute of Network Society

第一届网络社会年会主题报告 | 全喜卿：以同质性治理——作为区隔的网络科学

第一届网络社会年会主题报告 | 全喜卿：以同质性治理——作为区隔的网络科学

第一届网络社会年会主题报告 | 全喜卿：以同质性治理——作为区隔的网络科学

No comments yet