论文部分内容阅读
在很多情况下,人们不愿意将个人的敏感信息告诉陌生人,因此可信数据缺少成为医学和社会研究中主要障碍。幸运的是,统计推断是针对明确的总体而不是特别的个人。另外,在现有的很多应用中,数据可以利用网络系统或者其他移动设备来收集。基于这两个特征,我们提出具有隐私保护的新数据收集方法。新方法只收集变换后的数据,同时确保常用的统计方法可以得到与原始数据相同的分析结果。不仅数据一经产生就直接利用收集设备去掉身份信息,而且真实数据本身被全部屏蔽,使得敏感信息被变换,不再担心个体身份或者数据泄露。这样变换后的数据就可以公开和自由使用。这些新方法可以克服数据机密性的障碍,改善数据的收集与分析,促使大数据无约束的共享。