数据库***介绍
数据***(Data Masking),又称数据漂白、数据去隐私化或数据变形。百度百科对数据***的定义为:指对某些敏感信息通过***规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用***后的真实数据集。
随着大数据时代的到来,大数据商业价值的挖掘,用户的***大数据中蕴藏的巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战-个人隐私信息的保护。个人信息与个人行为(比如位置信息、消费行为、网络访问行为)等,这些都是人的隐私,也是我们所关注的一类敏感信息,在大数据价值挖掘的基础上如何保护人的隐私信息,也将是数据***必须解决的难题。
为什么需要数据库***?
所谓避免隐私数据***,是指避免使用数据的人员( 数据分析师,BI 工程师等)将某行数据识别为某个人的信息。数据***技术通过对数据进行***,如移除识别列,转换半识别列等方式,使得数据使用人员在保证可对#2 (转换后)半识别列,#3 敏感信息列以及#4其他列进行数据分析的基础上,在一定程度上保证其无法根据数据反识别用户,达到保证数据安全与较大化挖掘数据价值的平衡。
数据库内置***算法
识别出敏感数据之后,就需要使用***算法来进行***。在比较常见的数据***系统中,算法的选择一般是通过手工,比如通过内置丰富的***算法,对常见数据如姓名、***号、***账户、金额、日期、住址、电话号码、Email地址、***号、车架号、企业名称、工商注册号、***机构代码、***人识别号等敏感数据进行***。内置***算法具有如下几种:
1)同义替换
2)部分数据遮蔽
3)混合屏蔽
4)确定性屏蔽
5)可逆***
版权所有©2025 产品网