数据库***技术
通常在大数据平台中,数据以结构化的格式存储,每个表有诸多行组成,每行数据有诸多列组成。根据列的数据属性,数据列通常可以分为以下几种类型:可确切***某个人的列,称为可识别列,如身份号,地址以及姓名等。单列并不能***个人,但是多列信息可用来潜在的识别某个人,这些列被称为半识别列,如邮编号,生日及性别等。美国的一份研究称,仅使用邮编号,生日和性别信息即可识别87%的美国人。包含用户敏感信息的列,如交易数额,***以及收入等。其他不包含用户敏感信息的列。
数据库******风险模型
是对所有可标识列进行移除或是***,使得攻击者无法直接标识用户。但是攻击者还是有可能通过多个半标识列的属性值识别个人。攻击者可能通过社工(知道某个人的姓名,邮编,生日,性别等)或是其他包含个人信息的以开放数据库获得特定个人的半标识列属性值,并与大数据平台数据进行匹配,从而得到特定个人的敏感信息。如果攻击者知道某用户的邮编和年龄,就可以得到该用户的***敏感信息。为了避免这种情况的发生,通常需要对半标识列进行***处理,如数据泛化等。数据泛化是将半标识列的数据替换为语义--致但更通用的数据,已上述数据为例,对邮编和年龄泛化后的数据。
数据库***从部署方式来看
串联接入到数据库服务器的前端和以插件的方式安装于数据库服务器当中,是数据库***系统发挥自身作用的较大前提。但串联接入和以插件的方式安装在服务器系统中,都会改变数据库服务器所处的网络环境,参与数据交互的过程,一旦串联“节点”或者插件出现故障,会对数据库产生未知的影响,轻者业务中断,重者数据丢失、损坏。
静态数据库***
静态***一般用于非生产环境,在不能将敏感数据存储于非生产环境的场合中,通过***程序转换生产数据,使数据内容及数据间的关联能够满足测试、开发中的问题排查需要,同时进行数据分析、数据挖掘等分折活动。而动态***通常用于生产环境,在敏感数据被低权限个体访问时才对其进行***,并能够根据策略执行相应的***方法。
版权所有©2025 产品网