个人隐私:互联网新金矿
除了维基百科,美国最大的50家网站的登录用户都会受到网上追踪
《国际先驱导报》特约撰稿宗君 记者张皓雯发自北京 “天空没有留下翅膀的痕迹,但我已经飞过”,泰戈尔的名句在网络时代恐怕不适用了——网络时代,雁过无痕只是神话。只要你“飞过”,网上的痕迹便重重叠叠,勾勒出你的轮廓。
比如,你可能不知道有一家名叫[x+1]的公司,但这家公司知道你的很多事情。卡丽·伊萨克只是曾经点击过该公司的网站,[x+1]便对她的基本信息了如指掌:住在科罗拉多的斯普林斯市,是个年轻的母亲,每年收入约5万美元,习惯在沃尔玛超市购物,经常去租片店租一些小孩看的碟。
《华尔街日报》近日做的调查显示,全美最大的50家网站在每个访问者的电脑上平均安装了64种追踪技术。
“收集客户的信息和行为方式,是很多互联网公司都在做的事情。即使现在没做,将来也会做。”对互联网技术素有研究的魏章(化名)告诉记者,新型的网络追踪技术正在让个人隐私无所遁形,而出卖客户信息则成为互联网新的生财之道。
可怕的数据中间商
[x+1]公司利用时下互联网上非常流行的追踪技术来收集用户的网站浏览记录,形成一个记录人们上网行为的庞大数据库。
它不记录人们的姓名,但会将收集到的个人标识与其住房拥有情况、家庭收入、婚姻状况和常去的餐厅等众多信息进行交叉比对和汇集,然后通过统计分析,推测上网者的个人喜好。
当这些信息被卖给信用卡公司时,该公司会根据[x+1]公司的计算结果来决定向其网站的访问者显示、推荐哪一款信用卡产品。当然,信用卡公司只是[x+1]公司的客户之一。
纽约的Lotame公司则通过一种名为“灯塔”(beacons)的复杂追踪软件来实现对用户的监控。“灯塔”有时也会被称作“网络爬虫”,是一种很小的在网页上运行的软件。它们可以记录用户在网页上的操作,比如他们打了什么字,鼠标移动到了什么地方等。
Lotame公司通过捕捉人们在网站上输入的文字,比如对电影的评论,或者他们参与为人父母和怀孕话题的讨论等来分析用户的特征,并打包归类。
贝蒂就不幸中招。她被归入电影爱好者的包裹,其信息以十分之一美分的价格出售给别人。代表贝蒂的是一组代码:4c812db292272995e5416a323e79bd37。这个代码把贝蒂标识为一个住在田纳西州首府纳什维尔市的26岁女性。代码并不显示贝蒂的真实姓名,但是可以迅速地显示贝蒂最喜欢的电影有《公主新娘》和《初恋50次》,也知道她喜欢电视连续剧《欲望都市》,喜欢浏览娱乐新闻,喜欢玩问答游戏。
除了姓名,一览无遗
这些公司依赖的追踪技术可以分为三类:最基本的是cookies(一种用来追踪使用者上网习惯的小档案,由网站服务器储存在客户端的计算机上),更强大的Flash cookies,以及引入了一定软件成分的“灯塔”。
追踪公司使用cookies通常是为了构筑一份特定电脑访问网页的浏览记录;Flash cookies除此之外,可以重装用户删除的常规cookies,这就意味着他们可以在用户试图避开线上追踪时打开后门;而最新的技术“灯塔”能够通过记录更为细微的网上行为,如所打文字等,得到更多的用户信息。
像[x+1]公司这样的数据中间商所掌握的分析技术正在改变互联网的面貌。人们在网络上除了姓名不公开,其它隐私一概暴露无遗。
追踪文件的开发者Targus公司就透露,微软旗下的网站MSN.com上植入了追踪文件,通过追踪上网者,微软可以得到用户的年龄、邮政编码、性别,还有大概的个人收入、婚姻状况、有无子女、住宅情况等信息。而在用户登录eBay几秒钟之后,其行为细节的资料就可能已经登上了西雅图初创公司BlueKai的拍卖台。每天,BlueKai都要售出像这样大约5000万份关于个人浏览习惯的资料,价格最便宜是每份0.1美分,拍卖随时都可以发生。
陷阱密布,中国也“过火”
互联网公司利用cookies来追踪并收集用户的使用习惯在几年前就开始了,虽然也受到质疑,但因为没有激起什么大的事件,并未受到普遍关注。
令人郁闷的是这种可怕的网络追踪技术正在泛滥,让人防不胜防。《华尔街日报》近日对cookie以及其他各种可用于监视互联网用户的技术进行评估和分析,结果显示,消费者追踪行为的广度和侵入程度已经远远超出人们的认知,只有该行业的少数前沿人士才知道实情。
调查发现,全美最大的50家网站在每个访问者的电脑上平均安装了64种追踪技术,而且通常都不给任何提示。十多家其他网站安装的追踪技术甚至超过上百种。只有非盈利机构维基百科没有安装任何一种追踪技术。
更为可怕的是,一些工具甚至可以在用户试图删除它们时悄悄地自我复制,而且这些用户的资料处于持续更新状态。
在中国,互联网公司也大都使用了cookies技术,进行诸如保存浏览记录、在Web页上保存密码、针对不同用户进行广告投放等等行为。不过,还没有出现类似[x+1]公司这样的专业数据分析商以此牟利。
魏章介绍,有些方面,中国的网站“做得更过火一些”。比如很多社交网站,一旦你在上面输入了你的MSN或者QQ的帐号和密码,网站就会自动登录你的MSN或者QQ,抓取好友列表,发邮件通知他们,你在这个社交网站已经注册。
“他们希望以此拓展用户,迅速发展起来。”魏章介绍,最让人担忧的是,一些小一点的网站,所记录的上网者的密码,没有任何加密的措施。
“有人曾经做过测试,利用一个旅游网站的技术漏洞,轻易就从它的数据库中取走了几万个用户的信息和密码。由于密码没有加密,获取者可以直接看到密码是什么。”魏章说。
不知不觉中被“定向”
目前在互联网上,成长最快速的生意之一就是监视互联网用户,建立丰富的消费者数据库,并将用户资料出卖给寻找潜在消费群的广告商或企业。
互联网用户和广告投放者之间,存在着100多家中间机构,包括追踪公司、数据中间商和广告投放者网络等。它们彼此竞争,以满足企业对消费者行为和偏好的日益增长的数据需求。
拍卖个人信息的类似股市的交易所则在过去18个月中如雨后春笋般涌现出来。
据统计,消费者追踪现在已经成为了在线广告的基础。一位业内人士介绍,像谷歌、百度这样的搜索网站,都在追求这样的精准营销的模式:根据用户的信息判断其需求,进而投放相应的广告。
根据消费者特征投放的定向广告,价值远远高于非定向广告。一份广告行业三月份发布的调查报告显示,去年,美国定向广告的平均价格是每1000个浏览量4.12美元,而非定向广告只有1.98美元。
基于对上网者基本信息的了解,美国甚至出现了一种新型的定制化网站。它能够根据对访客的判断,对版面、内容和产品价格等进行调整。比如,纽约的Demdex公司帮助企业网站构建“消费者行为数据银行”,其中包括访客的网上浏览记录和个人消费项目等资料,还构建一个能够预测其工作职务高低的数据库。这家公司通过对数据进行深入分析,协助零售商根据不同访客的特性来定制其网站内容。
Demdex的首席执行官兰迪·尼古劳说,如果发现某个访客是一个处于中年危机的男性,那么Demdex服务的企业客户,如汽车零售商,就会向这样的男性展示红色的敞篷汽车,如果访客是一位年轻妈妈,他们向其展示的就是厢式旅行车。
一些理财公司也已经在开始使用这样的方法,根据对不同访问者的可能的收入和教育情况让他们看到不同的页面。
法律的真空地带
“当一个广告的定位足够准确时,广告就不再是广告,而是重要的信息。”一位广告业人士说。
但消费者却不容易买账,他们认为有些定向广告会对生活造成很糟糕的影响。去年,德州的教育软件设计师普雷斯顿上网查找过关于子宫疾患的内容。很快,她开始注意到无论自己去哪个网站,都会看到大量这方面的广告。现在,她已经清楚地知道自己其实并没有患病,但广告还是铺天盖地而来。她说,这简直让她“身心俱疲”。
另外一些用户则很担心隐私泄露的安全问题。
对此,这些追踪公司表示,所获资料是匿名的,因为互联网用户的身份是以一个分配给其电脑的号码来进行标识的,而不是具体的姓名,所以不涉及个人隐私。比如,Lotame公司就表示,他们并不知道贝蒂这样的互联网用户的真实姓名,只是通过一个标示号码来了解他们的行为方式和偏好特征。如果有人不希望被追踪,还可以把自己从Lotame的监测系统中移除出去。
而按照美国法律,当用户访问一家网站,电脑被植入最简单的cookies是合法的。不过,对于那些更复杂的追踪技术,目前还没有判例。
“通过互联网追踪技术获取消费者数据应该是一种比较新的趋势,数据中间商出售经过分析整理后的用户信息,目前还没有法律明文规定这一行为是违法的,也不能将其简单认定为侵犯了用户的隐私权。”首都师范大学政法学院石国亮教授认为:“网络追踪技术这种手段本身并没有问题,关键是要看数据中间商把数据出售给了谁。如果客户信息被不法分子利用,那就会引发一系列社会问题。加强信息利用的监控是十分必要的。”