什么是大数据脱敏?
可确切定位某个人的列,称为可识别列,如身份证号,地址以及姓名等。
单列并不能定位个人,但是多列信息可用来潜在的识别某个人,这些列被称为半识别列,如邮编号,生日及性别等。美国的一份研究论文称,仅使用邮编号,生日和性别信息即可识别87%的美国人。
包含用户敏感信息的列,如交易数额,疾病以及收入等。
其他不包含用户敏感信息的列。
大数据脱敏技术有哪些?
1.基于规则的脱敏方法:根据不同的敏感程度,制定相应的脱敏规则。对于姓名、联系方式等个人信息,可以将关键信息用“*”代替。如“王*”、“180****0329”。
2.加密脱敏方法:对敏感数据进行加密处理,只有授权的人员可以解密。例如,对于银行账号、信用卡号等敏感信息,可以使用加密算法进行脱敏,只有经过授权的人员才能够查看原始数据。
3.伪装脱敏方法:将敏感数据替换成其他的数据,以达到保护隐私的目的。例如,对于地理位置信息,可以将具体地址替换成地图上的某个随机点,或者将经纬度加上一定的随机偏移量来进行伪装。
4.数据扰动脱敏方法:将原始数据进行随机化处理,以达到数据保护的目的。例如,对于数字类型的敏感数据,可以对其进行扰动处理,添加一定的随机误差,从而使得原始数据不易被还原。
5.数据屏蔽脱敏方法:对于一些敏感数据,可以采取屏蔽措施,避免其被存储、传输或使用。例如,可以将一些特定的数据列从数据库中删除或屏蔽掉,只有经过授权的人员才能够访问。
关键词: 大数据脱敏 什么是大数据脱敏 大数据脱敏技术有哪些 大数据脱敏介绍