数据库***规则
一般的***规则分类为可***与不可***两类。
可***类,指***后的数据可以通过一定的方式,可以***成原来的敏感数据,此类***规则主要指各类加解算***则。
不可***类,指***后的数据被***的部分使用任何方式都不能***出。-般可分为替换算法和生成算法两大类。替换算法即将需要***的部分使用定义好的字符或字符串替换,生成类算法则更复杂一些,要求***后的数据符合逻辑规则,即是“看 起来很真实的假数据”。
数据库******风险模型
是对所有可标识列进行移除或是***,使得攻击者无法直接标识用户。但是攻击者还是有可能通过多个半标识列的属性值识别个人。攻击者可能通过社工(知道某个人的姓名,邮编,生日,性别等)或是其他包含个人信息的以开放数据库获得特定个人的半标识列属性值,并与大数据平台数据进行匹配,从而得到特定个人的敏感信息。如果攻击者知道某用户的邮编和年龄,就可以得到该用户的***敏感信息。为了避免这种情况的发生,通常需要对半标识列进行***处理,如数据泛化等。数据泛化是将半标识列的数据替换为语义--致但更通用的数据,已上述数据为例,对邮编和年龄泛化后的数据。
数据***的实现方式有哪些?
1、 使用脚本进行***
事实上,很多用户在信息化发展的早期,就已经意识到了数据外发带来的敏感数据***的风险,那时候用户往往通过手动方式直接写一些代码或者脚本来实现数据的***变形,比如:简单的将敏感人的姓名、身份号等信息替换为另一个人的,或者将一段地址随机变为另一个地址。
2、使用的数据***产品进行***
近年来,随着各行业信息化管理制度的逐步完善、数据使用场景愈加复杂、***后数据度要求逐渐提升,为保证***果准确而,化的数据***产品逐渐成为了用户的普遍选择。相比传统的手工***方法,的***产品除了保证***效果可达,更重要的价值点在于提高***效率,在不给用户带来过多额外工作量的同时,较大程度节省用户操作时间。
数据库***方案
1、无效化方案在处理待***的数据时,通过对字段数据值进行 截断、加密、隐藏 等方式让敏感数据***,使其不再具有利用价值。一般采用特殊字符(*等)代替真值,这种隐藏敏感数据的方法简单,但缺点是用户无法得知原数据的格式,如果想要获取完整信息,要让用户***查询。比如我们将身份号用 * 替换真实数字就变成了 '220724 ****** 3523',非常简单。
2、随机值替换,字母变为随机字母,数字变为随机数字,文字随机替换文字的方式来改变敏感数据,这种方案的优点在于可以在一定程度上保留原有数据的格式,往往这种方法用户不易察觉的。我们看到 name 和 idnumber 字段进行了随机化***,而名字姓、氏随机化稍有特殊,需要有对应姓氏字典数据支持。
3、数据替换与前边的无效化方式比较相似,不同的是这里不以特殊字符进行遮挡,而是用一个设定的虚拟值替换真值。比如说我们将手机统一设置成 “13651300000”。
4、对称加密是一种特殊的可逆***方法,通过加密密钥和算法对敏感数据进行加密,密文格式与原始数据在逻辑规则上一致,通过密钥可以***原始数据,要注意的就是密钥的安全性。
5、平均值方案经常用在统计场景,针对数值型数据,我们先计算它们的均值,然后使***后的值在均值附近随机分布,从而保持数据的总和不变。
版权所有©2025 产品网