大数据时代下个人隐私保护——人工智能在行动
同样是为了保护个人隐私数据,欧洲在2016年提出了数据隐私保护法规(GDPR),该规定要求公司不能在未经用户允许的情况下使用用户的数据,并且用户产生的数据不会离开自己的设备。换句话说,你的隐私数据只存储在你自己的设备中,不会上传到服务器,并且只有在得到你同意后才能对其进行操作。
举个栗子:我们每天使用输入法进行文本输入,一般情况下这些app会将我们的输入信息发送到服务器并记录下来,通过深度学习技术来预测你的下一步输入,我们在享受技术带给我们的便捷输入的同时牺牲掉了我们的数据隐私(通过输入法编辑的内容可能会暴露个人喜好、行为习惯等)。
于是谷歌就提出了名为联邦学习(Federated Learning)的深度学习模型,中心服务端将一个通用的模型发送给每个用户,模型+用户设备里的隐私数据 得到一个梯度信息,将所有用户的梯度信息加密后上传,中心服务端更新模型后重复这个过程。
这样隐私数据不用上传,除了自己以外没有人能够获取你的隐私数据(包括服务商!),通过这种技术将大家的隐私好好保护了起来。
另一个例子就是医疗隐私数据。每个人都可能会生病,但是对于病情大家都不约而同的希望能够保密。联邦学习通过对病患数据进行加密,使得每个医院都无法获得其他医院的病患数据,但是却能利用这些加密数据进行学习,起到与直接分享病患数据一样的效果!
在大数据时代,人们需要享有数据权,越是对数据科学研究的深入,越能感受到隐私暴露的可怕。请大家不要担心与悲观,将”大数据的权力“关进技术的笼子是我们的责任,在享受大数据这把双刃剑带给大家帮助的前提下,通过技术的提升保护大家,减少隐私暴露对个人的伤害。