日本东京地铁上通勤者的电话和文本记录能揭示很多信息。图片来源:Issyplante
元数据是一个直到2013年才为大多数人所知的晦涩的数据科学术语。2013年,人们得知,美国国家安全局(NSA)正从其电话呼叫中获取海量元数据。政府官员对此类数据的敏感性予以轻描淡写,但对电话元数据进行的众包研究如今发现,从通话对象的简单列表中便能获得具有高度揭示性的信息。
NSA对公民私人生活的侵犯或许让学术界人士愤怒不已,但该情报机关从电话元数据中获取到何种内容一直不得而知。2013年,一位白宫发言人向公众再次保证,元数据获取“并不允许政府窃听任何人的电话呼叫”,因此不会侵害隐私。自此以后,来自斯坦福大学的3位计算机专家——Jonathan Mayer、Patrick Mutchler和John Mitchell便开始自己获取电话元数据,以确定其能揭示什么内容。
和NSA不同,研究人员在征得人们同意的前提下收集了数据。这些人均下载了一个名为MetaPhone的应用程序。一旦被安装到智能手机上,该应用程序便能收集打出、接到每个电话以及发出、收到每条文本信息的电话号码和时间。800余人下载了该程序,并且同意这一做法。如果他们的隐私真的受到保护,那么对其120万条文本信息和25万个电话呼叫的记录应当透露不了什么信息。
事实上,这些元数据透露了相当多的信息。利用公开信息和廉价商业数据库,元数据揭示了大多数人的位置和身份。该团队在日前出版的美国《国家科学院院刊》上报告了这一发现。简单地通过电话记录将人们同各种诊所、商店和机构联系在一起,即便是非常隐私的细节比如慢性健康问题、宗教信仰和药物使用,也能呈现出来。
“此项研究对于监控法律和政策有着重要影响。”普林斯顿大学计算机专家和数据隐私专家Arvind Narayanan表示。同时,和学术界研究人员相比,NSA拥有更多数据和资源。“如果能获得上百万条记录和复杂的机器学习技术,一个人很可能获取到更加完整的个人敏感信息和行为。”(宗华)
《中国科学报》 (2016-05-19 第3版 国际)
更多阅读