羊城晚报记者 梁爽
中山大学软件学院的学生研究出一款智能社交工具,自称“微博界的007”,可以在新浪微博上挖出你的“八卦”料,读者诸君你信吗?记者怀着好奇心,上网一探究竟!这个名叫“中大八卦”的新浪微博账号,虽仅发了5条微博,却“出手不凡”,能精准分析任意微博用户的喜好、密友等个人信息,能知道你的“八卦”材料!连这款智能工具的推广者都惊叹:“专业的数据挖掘和语义分析已经可以做到令人生畏的地步了!”
有网友质疑,如此利用公开信息进行二次处理和使用是否侵犯隐私权?有专家认为,收集、整理并使用网络上碎片化的公开信息,并不存在侵犯隐私权的情况。
现象
“八卦君”铁嘴神算 “躺枪君”当场泪奔
“××同学,八卦君没能从你的微博里分析出你的名字,但是你应该是博济工作室的,来自中山大学医学院,你喜欢浏览果壳网,崇尚养生学,对犯罪心理略有兴趣,你是一个80后,你的女生缘比男生缘好,粉丝中女性占多数。有人告诉八卦君,(你是)喜欢站厕所里哼香飘飘的猥琐男,也有人说你是一个好人。”
以上微博由新浪微博@中大八卦所发,自称“八卦君”的@中大八卦还邀请这位网友的4位“闺蜜”前来评论。虽然微博中并未涉及特别的隐私,但依然让该网友和他的朋友们感到震惊。“求别这样!”这位被“八卦”的网友在评论中发了多个流泪的表情,“我已经莫名其妙了……怎么能随意@这么多人呢!”
在简介中可以了解到,“中大八卦”是中山大学软件学院学生做的一款基于新浪微博平台进行数据挖掘的社交工具,目前尚在完善中。将腾讯微信账号“—找小七”添加为好友后,输入任意新浪微博网友名称,你便可以检索出这个网友的喜好、密友、八卦等关键词列表;若你愿意,可以匿名将这位网友的关键词列表分享到新浪微博@—找小八上去;部分“热门”网友的趣味信息则会被发到@中大八卦中,这些语义通顺的趣味信息完全由机器人自动生成。
解密
如何通过微博信息 分析你的个性特征
如果某个人发微博说“今天的话剧真好看”,我们能否推测他是话剧爱好者,或者刚刚看完一场话剧?
如果能从微博公开信息中推测出一个网友的班级、职业等基本信息,那么是否能推测出他所在的圈子,以及这个圈子中的其他人?
@中大八卦的微博管理员、中山大学资讯管理学院的大二学生小高向记者提出以上问题。“‘中大八卦’是中山大学软件学院的一个数据挖掘和语义分析技术科研项目中开发的小应用,科研项目负责人是软院副教授徐亚波,这个应用的目的是通过软件快速了解一个人。”小高告诉记者,“人”的信息具有很高价值,“如果你参加面试,可以通过软件查出老板的微博账号、性格、爱好;如果你想追求一个妹子,知道一点点信息就可以‘八’出她全部资料;未来有了‘圈子’功能,商家可以用它直接进行营销。”
不需要卧底、不需要黑客,所有的推测均来源于新浪微博上的公开信息,所使用的技术叫做“数据挖掘”。
“数据挖掘让人与人之间变得透明。”小高说。
据小高介绍,这款智能八卦软件在微信上线两个月,正式推广一个多星期,目前有1400多名用户,已完成8000—10000次搜索任务。平均每个用户会“八卦”5—8人。1400多名用户中仅有10个人反馈称搜索不准确。
质疑
微博私信也被分析 网友顾虑隐私遭侵
使用并分析网友的微博,需要申请新浪微博的授权,不论是微博正文、好友列表还是私信内容,都是可以公开分析的。
“包括地理位置、你在某个页面停留的时间、你点击的链接,我们都可以看到。你在网络上的一切信息,都要做好公开的心理准备。”小高说。
虽然系统后台每次检索都会生成一段较为精准的综合性文字,但为了保护隐私,系统一般只提供“喜好”、“密友”和“八卦”三个关键词列表。截止到记者发稿时,只有4名网友的整体描述被公开在@中大八卦上。据小高介绍,这是为了测试网友反应。他们的顾虑是对的,第一位被公开“八卦”的网友就在评论中表达了质疑:“这样把别人的东西放出来,不好吧?”
“我们既要感慨技术的强大,也要思考一下伦理和法律问题。用户是否觉得被侵犯了隐私?侵权的界限在哪里?”小高在探索,“最大的疑问在于,如果用户本身并没有在微博上公开自己是中大的学生,也不愿意公开,但我们系统分析并公布出来了,这里是否有问题?”
声音
挖掘公开碎片信息 不存在侵犯隐私权
网络公开信息的二次处理和使用是否侵犯隐私权?记者采访了中山大学法学院副教授张民安,他认为这收集、整理并使用网络上碎片化的公开信息,并不存在侵犯隐私权的情况。
他表示,如果一个人自愿把自己的信息在微博上公开,那么这条信息已经自动进入公共领域,不算隐私。既然已经公开,其他人便可以使用这些信息。“微博是对社会公众开放的,至少对某些人开放。既然你愿意将很隐秘的信息公开,那就表明你愿意承担风险,不能对公开的信息抱有隐私期待。新浪如何使用这些信息,都是没有问题的。”张民安说。
张民安说,用户若能在授权前特别约定“只授权给新浪使用”,授权时尽量对信息的使用目的和使用期限有一个清晰的约定,那么,如果新浪使用信息过程中违反此约定,就可能构成侵权。否则,在一开始授权时没有特别说明,新浪便默认你允许他使用信息。
“在信息社会,单个的个体信息价值很小,但如果经过加工、整合,形成一个数据库,就有极高的价值,特别是对于商家。”张民安说,“个人信息被侵权也可能只是上百万条信息中的一个,很难证明自己在精神和财产上有损害,起诉的成本很高,胜诉的希望很小。目前很难通过侵权法、民法来界定此类侵权,必须动用刑法、行政法来重新界定,才能有效约束非法加工、非法出卖信息的人。”
同时,张民安认为,很多商家大批量收集网络上支离破碎的信息并进行处理,并非针对个人,因此网友大可不必恐慌。“信息社会其实就是个体和商人之间的互动过程。个体通过各种途径拼命向社会公开信息,商人和机构通过各种途径拼命收集你的信息,然后加工整理信息,形成信息资产。”
梁爽
我来说两句排行榜