在数据越来越值钱的年代,数据的保护也越来越重要,数据脱敏便是保护数据的一种常见的方式,但当进入了大数据时代之后,简单的数据脱敏已经无法适用于海量的数据和新的数据存储方式,数据脱敏的技术也随之更新,开启了动态数据脱敏的数据保护新时代。
什么是数据脱敏?数据脱敏是指针对某些敏感信息通过特定的脱敏规则进行数据的变形,已达到实现敏感隐私数据的可靠保护的目的。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用。一般情况下需要脱敏的数据为身份证号,手机号,银行卡号居多,这一方面是企业保障自身的客户信息不泄露,另一方面也保障了用户的信息安全。
那么面对大数据,如何实现数据的脱敏?这就需要用到策略的规则和策略引擎,实现不同维度和层级的颗粒度脱敏,比如针对某张表,制定的列或者列簇脱敏,其实对技术的要求也更加高,便产生了动态的脱敏,例如HIVE和HBASE的动态脱敏。
腾讯云安全提供的大数据动态脱敏可以有效保障大数据的安全,且是平台级的,更加便于操作。其原理是在应用端当数据请求达到大数据集群的代理程序时,首先从大数据安全平台的策略库拉取策略,然后经过HDFS/HIVE/HBASE组件经过写和读的操作将数据返回至代理,在读的时候根据策略动态进行脱敏之后将数据返回给用户。
至于动态脱敏所用到的脱敏规则,自然是针对不同的脱敏处理方式,将需要进行脱敏的数据分类,再为每个分类设定脱敏规则,例如常见的身份证年龄段数据的模糊,电话号码后几位模糊等。
既然数据脱敏依靠的是策略,那么策略管理就是动态数据脱敏最重要的核心部分。脱敏的策略是专门针对哪些客户端对哪些目标资源发起了数据获取请求后,进行脱敏处理的一系列依据。如:用户、客户端IP、操作类型、资源、执行语句等不同维度的条件组合成一条策略,并设置脱敏规则。
策略引擎会依据配置的策略来进行调度和处理,并且可细化到不同层级,如:HBASE可以针对表、列簇、列进行脱敏处理;HIVE可以对数据库、表、列进行脱敏管理。策略引擎会定期将最新版本的策略同步到各个安全插件端,并同时做离线优化处理(如:策略优先级排序、资源分组等)。立即生效和启用新的策略方案,对数据实施及时的保护。
那么何为动态数据脱敏?当对HBASE、HIVE组件发起任何的数据请求时,都将通过安全插件进行过滤。安全插件会依据本地缓存的安全策略,对数据请求例行检查。获取到用户请求中的参数(用户名、IP、执行语句、操作类型、目标资源等)来进行安全扫描,一旦发现有与之匹配的安全策略,大数据安全插件会根据策略条件为依据,决定是否对数据请求进行跟踪监控。
被监控跟踪的数据请求,我们便认为是需要进行脱敏处理的,等到其返回数据结果后,安全插件会对结果数据按照脱敏规则进行处理转换,再将脱敏后的数据返回给请求者。
通过动态脱敏的方式保障大数据的数据脱敏保障数据安全,提升体术能力,顺应时代的发展。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2020-04-29 17:08:33
2024-07-29 17:27:18
2022-11-21 11:11:19
2024-03-27 11:17:38
甄选10000+数字化产品 为您免费使用
申请试用
评论列表