删除(大数据取舍之道)
删除:大数据取舍之道
《删除:大数据取舍之道》喝醉的海盗
对于人类而言,遗忘一直是常态,而记忆才是例外。然而,由于数字技术与全球网络的发展,这种平衡已经被打破了。如今,往事正像刺青一样刻在我们的数字皮肤上,遗忘已经变成了例外,而记忆却成了常态……
在这个记忆已经成为常态的时代,难道每个公开自己信息的人只能永远对信息束手无策吗?我们真的想要一个由于无法遗忘,而永远不懂得宽恕的未来吗?
未来可能遭遇到的悲剧,会对我们现在的行为产生寒蝉效应。借助数字化记忆,圆形监狱能够随时随地监视我们。
事实上,并不是技术迫使我们去记忆。技术只是促进了遗忘的终止——而只有当我们迫切想要记住的时候,遗忘才会被终止。
喝醉的海盗
史黛西·施奈德(Stacy Snyder)最大的梦想就是成为一名教师。在 2006年春天,这位 25岁的单身母亲已经完成了她的学业,并且对她未来的事业充满了期待。但是她的梦想破碎了。她心仪的学校明确地告诉她,她不能成为一名教师,虽然她已经修满了所有的学分,通过了所有的考试,完成了所有的实习训练——而且在许多方面成绩优异。然而,她被取消了当教师的资格,理由是,她的行为与一名教师不相称。
她的行为?校方指的是一张网上的照片,照片里的她头戴一顶海盗帽子,举着塑料杯轻轻啜饮着。史黛西·施奈德曾将这张照片放在 MySpace她的个人网页上,并且取名为喝醉的海盗。这张照片她是给朋友看的,也许只是为了搞怪而已。然而,在史黛西实习的那所大学里,一位过度热心的教师发现了这张照片,并上报给校方,校方认为网上的这张照片是不符合教师这个职业的,因为学生可能会因看到教师喝酒的照片而受到不良影响。于是,史黛西打算将这张照片从她的个人网页上删除。但是危害已经发生了:她的个人网页已经被搜索引擎编录了,而且,她的照片已经被网络爬虫(web crawler)程序存档了。互联网记住了史黛西想要忘记的东西。
后来,史黛西控告了这所大学,但也没能最终胜诉。她认为,将那张照片放在网上并不能
说明一名未来教师的不称职和不专业。毕竟,在那张照片中并没有显示塑料杯里装的究竟是什么东西。即便显示了,史黛西,这位拥有两个孩子的单身母亲也早已达到了在私人聚会上喝酒的年龄。
然而,这个案例与大学是否应该给史黛西教师资格的正确性或愚蠢程度无关,而是与某种更为重要的东西有关,那就是遗忘的重要性。
《删除:大数据取舍之道》一个没有遗忘的时代
有史以来,对于我们人类而言,遗忘一直是常态,而记忆才是例外。然而,由于数字技术与全球网络的发展,这种平衡已经被改变了。今天,在广泛流行的技术的帮助下,遗忘已经变成了例外,而记忆却成了常态。这种局面是如何发生的,为什么会发生,对于我们个人和我们的社会而言这一局面的潜在后果是什么,以及针对这一局面,如果可能的话,我们能够做些什么,这些都是本书关注的问题。
对于某些人而言,史黛西·施奈德的遭遇可能听起来只是个例外,但其实不然。自此之后发生了许多起非常窘迫的案例,甚至是法律诉讼——从无法让互联网忘记十多年前细微证据的知名大律师,到由于在 facebook上抱怨工作无聊而因此失业的英国小姑娘。
截至 2008年,在 MySpace上拥有个人网页的人数超过 1.1亿,他们都和史黛西·施奈德一样。而且 MySpace并不是网民唯一青睐的社交网站。 MySpace的直接竞争者 facebook,截至 2009年年初,已经有 1.75亿个个人用户创建的在线网页。尽管 facebook MySpace都主要锁定美国市场(虽然这种局面正在改变),但是这种现象并非仅仅发生在美国。 Google公司旗下的社交网站 Orkut,已经拥有 1亿多名用户,而且大部分用户在巴西与印度。世界各地的其他多个网站还拥有至少 2亿名用户。这些数字反映了一个更为普遍的趋势。
8023是什么意思啊百科互联网浪潮的第一个阶段早已随网络泡沫及其破灭而告终,在这个阶段中,互联网的发展与访问信息以及通过全球网络与他人互动息息相关(你可以称其为 Web 1.0时代)。而到 2001年,用户开始意识到互联网并不仅仅只是一个接收信息的网络,而且还是你可以生成信息并与你的同龄人共享信息的网络(通常被称为 Web 2.0时代)。年轻人尤其喜欢 Web 2.0的这些性能。
2007年年底之前,美国的一家趋势调查机构皮尤研究中心(Pew Research)发现,三分之二的青少年参与了互联网上一个或者多个范围广泛的内容创建活动,而且在创建和
共享内容上,女孩要多于男孩。每天,facebook平均每秒钟都会收到来自世界各地用户的 1 000万个网络应用请求。约翰·帕尔弗雷(John Palfry)与乌斯每个月的14号·加瑟教授(Urs Gasser)曾充分论述,公开个人的信息都已经深深地嵌入了全球的青年文化中——无论是登入 facebook的次数、个人日志与评论、照片、好友状态,还是情侣关系(恋爱中或者只是朋友)、内容偏好与认同(在线照片或者标签)、个人的地理位置(通过地理标签或者类似 Dopplr的网站可获知),或者仅仅只是微博更新(比如 twitter边做边爱 歌词)。
延世大学研究生
随着这些年轻人逐渐长大,以及越来越多的成年人拥有类似地特征,史黛西·施奈德的遭遇将会不断被重演,而且不仅对于整整一代人是如此,对于我们整个社会也将如此。
《删除:大数据取舍之道》抹不掉的致幻剂阴影
虽然 Web 2.0刺激了这一局面的发展,但是传统出版业在互联网力量的推动下也导致了惊人相似的结果。让我们来看看安德鲁·费尔德玛(Andrew Feldmar)的遭遇。
这位六十多岁的加拿大心理咨询师生活在温哥华。 2006年的某一天,一位朋友从西雅图国际机场赶过来,费尔德玛打算穿过美国与加拿大的边境去接他,就像曾经上百次做过的那
样。但是这一次,边境卫兵用互联网搜索引擎查询了一下费尔德玛。搜索结果中显示出了一篇费尔德玛在 2001年为一本交叉学科杂志所写的文章,在文中他提到自己在 20世纪 60年代曾服用过致幻剂LSD。因此,费尔德玛被扣留了 4个小时,其间被采了指纹,之后还签署了一份声明,内容是他在大约斗罗大陆史莱克七怪 40年前曾服用过致幻剂,而且不准再进入美国境内。
安德鲁·费尔德玛是一位没有犯罪记录、拥有学识的专业人员,他知道当年服用致幻剂确实违反了法律,但是他坚称自 1974年以来就一直没再服用过。当边境卫兵拦下他时,这件事已经过去快 40年了。对于费尔德玛而言,那是他生命中一段早已远去的时光,一个他认为已被社会遗忘了许久、与现在的他完全不相干的过错。但是,数字技术已经让社会丧失了遗忘的能力,取而代之的则是完善的记忆。
有人会说,史黛西·施奈德的痛苦主要是由她自己造成的。她将她的照片放在自己的网页上,并且加了一个引发歧义的标题。或许,她并没有意识到全世界都能到她的网页,而且竟然在她删除照片很久之后,仍有可能通过互联网档案访问她的照片。作为互联网时代的一员,她也许应该更谨慎地考虑一下,哪些内容可以在互联网上公开。不过,安德鲁·费尔德玛的遭遇却与她不同。年近七十的他可不是十几岁的互联网发烧友,而且可能从来没
预料到,他在那样一本晦涩杂志上发表的文章,居然能在全球化的网络上如此容易地被到。对他而言,成为数字化记忆的受害者完全是一个可怕的突然袭击。
但是,即便史黛西与安德鲁能预见这个结果,难道这就意味着每个公开自己信息的人只能永远对信息束手无策吗?关于互联网是否会遗忘以及何时遗忘,难道我们没有一点发言权吗?我们真的想要一个由于无法遗忘,而永远不懂得宽恕的未来吗?
现在,青春期时一个愚蠢的错误会造成严重的后果,而且这个不良记录的阴影会一直笼罩着他们的余生。家庭教师协会(PTA)的联合主席凯瑟琳·戴维斯(Catherine Davis)评论说。如果我们不得不担心,关于我们的所有信息,将会被保留得比我们的寿命更长,我们还会对琐碎的流言蜚语发表我们的观点吗?我们还会轻松地分享个人的经历吗?我们还敢做出各种政治评论吗?我们还会进行自我审查吗?完善记忆的寒蝉效应 ①会改变我们的行为。
史黛西与费尔德玛表示,今后将会以完全不同的方式谨慎行事。当心你发布在网上的信息。史黛西说。而费尔德玛则更富见地地感叹,我要警告所有人,你留在网络上的电子足迹将在某一天对你造成伤害。那是无法被擦除的。
取舍之道
不再遗忘的后果,比人们建立并维护多年的声誉遭受一次正面攻击的后果要深远得多,也更让人苦恼。如果我们过去所有的行为,无论是否违法,都一直存在,那么当我们进行思考与决策时,怎样才能从自己的过去中解脱出来呢?完善的记忆会使我们对待他人像对待自己那样不宽恕吗?
尽管如此,史黛西与费尔德玛仍然自愿地公开关于他们遭遇的信息。从严格意义上来讲,他们也需要为这种公开的后果承担责任。然而,我们往往在公开自己的信息时,并没有真正意识到我们正在公开自己的信息。
《删除:大数据取舍之道》Google记得你的一切
在德国城市爱森纳赫(Eisenach)城外坐落着一家名叫 MAD的巨型迪斯科舞厅,它能容纳 4 000名顾客。当顾客进入这家舞厅时,他们必须出示他们的护照或者由政府发布的身份证;这些顾客的详细资料都被输入到一个数据库中,连同一起被存入的还包括他们的数字脸部照片。每名顾客都会有一张专用的支付卡,他们只能用这张卡支付在 MAD餐厅及多
个酒吧中消费酒水与食品的账单。每次交易都会被添加到顾客的永久数字记录中。据一次电视报导, 2007年年底之前, MAD数据库存储的信息包括一万三千多名顾客与几百万次交易。60台数字摄像机持续地拍摄迪斯科舞厅及周围的每个角落;记录与存储的录像所占的硬盘空间超过 8 000 G。顾客的实时信息、他们的交易行为,以及他们的消费偏好都被显示在一个专用控制室里的大屏幕上,这个控制室中的情景仿佛出自007电影一样。管理人员很自豪地说,每周7天每天企业上市的条件24个小时,当地的警察都能通过互联网在线访问 MAD舞厅硬盘里存储的信息。
即便有,也只是少数顾客才能意识到他们的一举一动都被记录了,并且会被保存多年,同时第三方机构还可以访问这些信息——这给成千上万名不知情的顾客造成了一种深远的信息阴影。
再举一个更为普遍的例子,互联网搜索引擎。 GoogleYahoo!、微软搜索、Ask以及对万维网(World Wide Web)进行编录的其他许多搜索引擎,通过对网页的逐个搜索,使得所有人仅在搜索框中键入一两个关键词就能访问这些网页。我们知道,同时假设搜索引擎也知道大量的信息,而且这些信息可以通过全球互联网上的网页进行获取。多年来,这
种易于使用且功能强大的搜索引擎,成功地将世界各地的信息资源展现在几十亿用户面前。然而,搜索引擎所记住的,要比网页上所发布的信息多得多。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。