数据库***作用
通过数据***产品,可以有效防止企业内部对隐私数据的滥用,防止隐私数据在未经***的情况下从企业流出。满足企业既要保护隐私数据,同时又保持监管合规,满足企业合规性。DMS提供了丰富的内置***算法和灵活的、流程化的策略和方案管理能力,支持对多种数据源进行***处理,帮助企业在不改变业务流程的前提下快速部署实施,有效的降低***的复杂度和风险,控制***成本。
数据库***技术
通常在大数据平台中,数据以结构化的格式存储,每个表有诸多行组成,每行数据有诸多列组成。根据列的数据属性,数据列通常可以分为以下几种类型:可确切***某个人的列,称为可识别列,如身份号,地址以及姓名等。单列并不能***个人,但是多列信息可用来潜在的识别某个人,这些列被称为半识别列,如邮编号,生日及性别等。美国的一份研究称,仅使用邮编号,生日和性别信息即可识别87%的美国人。包含用户敏感信息的列,如交易数额,***以及收入等。其他不包含用户敏感信息的列。
数据库******风险可控
实现基于大数据平台的***算法库,可并行,的按照***规则对隐私数据进行***。基于数据***的理论基础,建立用户隐私数据***风险的衡量模型,可定性定量的准确衡量数据可能发生***的风险。可管理。结合大数据平台的用户认证体系,权限管理体系,以及隐私数据不同保护级别的权限管理体系,实现对隐私数据基于审批的数据访问机制。结合公司制度,规范,法务等管理,实现在尽可能保护用户隐私数据,减少数据***风险的前提下,较大化保留数据分析挖掘的价值。可审计。对数据的访问要保证可回溯,可审计,当发生数据***时,要保证能够通过审计日志找到对应的***人员。
数据库***实现背后的秘密
数据***功能,基于SQL引擎既有的实现框架,在受限用户执行查询语句过程中,实现外部不感知的实时***处理。关于其内部实现,如上图所示。我们将***策略(Redaction Policy)视为表对象上绑定的规则,在优化器查询重写阶段,遍历Query Tree中TargetList的每个TargetEntry,如若涉及基表的某个***列,且当前***规则生效(即满足***策略的生效条件且enable开启状态),则断定此TargetEntry中涉及要***的Var对象,此时,遍历***列系统表pg_redaction_column,查找到对应***列绑定的***函数,将其替换成对应的FuncExpr即可。
经过上述对Query Tree的重写处理,优化器会自动生成新的执行计划,执行器遵照新的计划执行,查询结果将对敏感数据做***处理。带有数据***的语句执行,相较于原始语句,增加了数据***的逻辑处理,势必会给查询带来额外的开销。这部分开销,主要受表的数据规模、查询目标列涉及的***列数、***列采用的***函数三方面因素影响。
版权所有©2025 产品网