现在,大多数人都会通过电脑、手机等使用互联网。十多年前,人们就发现,通过分析用户使用网络搜索引擎所留下的信息甚至就可以推断出这个人是谁。今天的互联网更是不可同日而语,使用大数据的互联网知道你的习惯、喜好,甚至是你的私密个人信息。例如,近期有媒体的文章分析称,google对你的了解甚至会超过你的朋友和家人对你的了解。
大数据对人们的日常生活有怎样的帮助和影响?人们在拥抱大数据时代的同时,如何注重自己的隐私保护?企业应该怎么做?本台记者刘俊杰就此话题采访了迪肯大学信息技术学院副教授,IEEE数据挖掘和大数据分析技术委员会副主席李罡副教授。他首先提到了搜索引擎Google对用户信息的了解程度。在采访中,李罡博士提到,1965年到2016年间著名的摩尔定律Moore's law估计每1-2年,存储器的容量会翻倍,该定律存活了51年。处理器和存储器等设备的性能大幅提升,成本大幅降低,硬件条件具备之后,用户使用互联网门槛变低,使用时间和频率更高,而大的互联网公司也会全方位的收集产品和用户个人数据等信息。
Associate professor Gang Li from the School of Information Technology at Deakin University. Source: Supplied
“躲”在计算机之后的用户更愿意全方位展现“真实的”自己。搜索引擎会记录并能“更真实地”反应用户的个人行为特征甚至性格,将数据和活生生的人联系起来。
尽管很多数据和个人信息没有直接关系,但是如果放在一起,即使是匿名的数据也会很清楚的揭示我们是谁。
大数据最主要的应用之一就是“了解用户”。例如,用户画像——即使你在社交媒体上没有提供真实信息,大数据仍然很有可能知道你的性别、年龄、甚至真实名字。李博士还举了一个北京公交卡刷卡习惯的例子,短、频、快的公交卡使用者很有可能是小偷;长时间逗留地铁系统的公交卡使用者不少是卖艺、售卖东西或者是送快递的人员。
李博士还通过大数据向香港政府提供交通路线的规划建设建议。
李罡博士还列举了真实的经典案例说明为什么大的网络公司在个人信息等大数据方面很谨慎的原因。2006年8月份,美国在线公司AOL公布了65.8万用户ID3个月的真实的搜索记录。纽约时报记者根据搜索数据(地址和名字)轻易地,这个老太太证实那些列出的搜索词确实是她搜的。AOL也因此引来很大的麻烦。此后,数据发布界或者搜索引擎界都基本不会发布即使经过匿名处理的原始数据。
李罡博士坦言,如果要想获得“免费”“优质”的信息,个人留下自己相关的数据基本上是很难避免的。不过,如果想最大限度的保障个人信息安全和减少个人在网上留下的“痕迹”,应该尽量少用免费Wifi,通过使用Private的模式等方式使用网络。
READ MORE
中共党员干部用微信建群要报告 ”网络行为“出格”将被严惩
Source: sbs mandarin