数据库-泄露风险模型
是对所有可标识列进行移除或是-,使得攻击者无法直接标识用户。但是攻击者还是有可能通过多个半标识列的属性值识别个人。攻击者可能通过社工(知道某个人的姓名,邮编,生日,性别等)或是其他包含-的以开放数据库获得特定个人的半标识列属性值,并与大数据平台数据进行匹配,从而得到特定个人的-息。如果攻击者知道某用户的邮编和年龄,就可以得到该用户的--息。为了避免这种情况的发生,通常需要对半标识列进行-处理,如数据泛化等。数据泛化是将半标识列的数据替换为语义--致但更通用的数据,已上述数据为例,对邮编和年龄泛化后的数据。
数据库-泄露风险可控
实现基于大数据平台的-算法库,可并行,的按照-规则对-数据进行-。基于数据-的理论基础,建立用户-数据泄露风险的衡量模型,可定性定量的准确衡量数据可能发生泄露的风险。可管理。结合大数据平台的用户体系,权限管理体系,以及-数据不同保护级别的权限管理体系,实现对-数据基于审批的数据访问机制。结合公司制度,规范,法务等管理,实现在尽可能保护用户-数据,减少数据泄露风险的前提下,较大化保留数据分析挖掘的价值。可审计。对数据的访问要-可回溯,可审计,当发生数据泄露时,要-能够通过审计日志找到对应的泄露人员。
数据库-从部署方式来看
串联接入到数据库服务器的前端和以插件的方式安装于数据库服务器当中,是数据库-系统发挥自身作用的较大前提。但串联接入和以插件的方式安装在服务器系统中,都会改变数据库服务器所处的网络环境,参与数据交互的过程,一旦串联“节点”或者插件出现故障,会对数据库产生未知的影响,轻者业务中断,重者数据丢失、损坏。
数据库-方案
1、无效化方案在处理待-的数据时,通过对字段数据值进行 截断、加密、隐藏 等方式让敏感数据-,使其不再具有利用价值。一般采用特殊字符*等代替-,这种隐藏敏感数据的方法简单,但缺点是用户无法得知原数据的格式,如果想要获取完整信息,要让用户授权查询。比如我们将身份号用 * 替换真实数字就变成了 220724 ------ 3523,非常简单。
2、随机值替换,字母变为随机字母,数字变为随机数字,文字随机替换文字的方式来改变敏感数据,这种方案的优点在于可以在一定程度上保留原有数据的格式,往往这种方法用户不易察觉的。我们看到 name 和 idnumber 字段进行了随机化-,而名字姓、氏随机化稍有特殊,需要有对应姓氏字典数据支持。
3、数据替换与前边的无效化方式比较相似,不同的是这里不以特殊字符进行遮挡,而是用一个设定的虚拟值替换-。比如说我们将手机统一设置成 “13651300000”。
4、对称加密是一种特殊的可逆-方法,通过加密密钥和算法对敏感数据进行加密,密文格式与原始数据在逻辑规则上一致,通过密钥可以恢复原始数据,要注意的就是密钥的安全性。
5、平均值方案经常用在统计场景,针对数值型数据,我们先计算它们的均值,然后使-后的值在均值附近随机分布,从而保持数据的总和不变。
联系时请说明是在云商网上看到的此信息,谢谢!
本页网址:https://www.ynshangji.com/xw/27959818.html