iconV2.0-平台化脱敏icon

脱敏操作流程化:自动发现敏感数据:采用数据字典、正则表达式等方式,自动发现数据库中存储敏感数据的数据对象。

数据发现
内置发现规则
自定义发现规则
抽样发现
确定脱敏范围
选定数据对象
设置数据子集
数据关联和切片
确定脱敏策略
基于数据类型配置脱敏算法
基于数据对象配置脱敏算法
执行脱敏任务
任务执行配置
执行状态监控
任务日志
iconV3.0-智能脱敏icon
智能发现

基于NER的智能识别算法,以及智能随机采样,能有效去除脏数据,使得敏感数据识别更准确。

智能抽取

可调的批处理量值,基于时间戳、主键、分区等过滤条件的自动并行抽取,提高抽取销量。

智能脱敏

保留数值统计特征脱敏,身份信息关联脱敏;任务定期执行;断点续传;智能异常处理;脱敏报表。

icon产品架构icon

分布式运算引擎,便于任务分布式运行,充分调动各个节点资源,保证脱敏效率。同时增强任务的容错能力。

icon数据静态脱敏系统重要特性icon
丰富数据源
关系型数据库
大数据组件
数据仓库
数据文件
智能赋能
敏感数据发现
数据关系保持
保证数据一致性
脏数据处理
灵活的脱敏方式
数据库到数据库、数据库到文件、 文件到数据库、文件到文件
自动化管理
脱敏任务定期执行;断点续传;高度容错;源表的主键、索引、唯一约束自动同步迁移
预置丰富算法
置空、乱序、遮蔽、分割、替换、取整、哈希、仿真、密码学、编码、保留数值统计特征、关联关系保留、溯源算法
icon产品优势-领先的算法icon
行业领先的敏感字段识别算法
开箱即用70多种通用敏感字段识别算法。支持丰富的敏感数据识别技术:包括正则表达式、关键字典、机器学习、NLP、文档指纹等先进AI技术创建识别规则、实体识别模型。数据采样采用全局随机采样的方式,有效避免了脏数据的干扰。包括但不限于姓名、性别、手机号、固定电话、邮箱、民族、血型、学历、政治面貌、婚姻状况、身份证、车牌号、车架号、护照号、台胞证、港澳通行证、军官证、银行卡、驾驶证编号、机构名称、纳税识别号、组织机构代码、营业执照号码、统一社会信用代码、MAC地址、URL地址、MEID、IMEI、IP地址、IPv6地址、JDBC连接串、邮政编码、城市、省份、详细地址、日期、时间、基金代码、股票代码、基金名称、股票名称等。 同时,客户可以根据自身业务需求自定义新增数据识别规则。
icon产品优势-引入NLP算法icon

命名实体识别(Named Entities Recognition, NER)是自然语言处理(NLP)的一个分支,其目的是识别语料中人名、地名等命名实体。由于这些命名实体数量不断增加,通常不可能在词典中穷尽列出(通常产品识别姓名通过字典枚举的方式,识别广度与精度受限于字典中姓,名的枚举个数),所以需要命名实体识别来自动学习其构成方法中的一些规律性。产品内置基于深度学习+条件随机场算法的(BiLSTM+CRF)命名实体识别模型,可准确识别人名、地名、机构名称、时间、日期、金额等各类实体内容 。在如下产品截图中,要进行保留姓,对名进行仿真脱敏,利用NER算法,能准确将“诸” 和“诸葛”这两个姓给识别出来,从而保证脱敏效果符合预期。

icon产品优势-数据智能识别icon
icon产品优势-丰富的优势算法icon
独有敏感字段发现规则
url、jdbc、imei、民族、血型、学历、政治面貌、婚姻状况、国籍编码、邮政编码、加密数据
独有脱敏算法
保留数学特征算法:标准化、归一化、添加噪声、保留频次特征、平均、分布重建、计算关系关联保留、身份信息关联保留、乱序关联保留
icon国内首家支持面向机器学习任务的脱敏算法(1/2)icon

某医疗单位的肿瘤样本数据交付给第三方研究机构进行数据分析,如何保障分析结果的前提下,不泄露敏感数据?一、样本编号:使用一致性关联算法,对样本编号(图中身份证号)进行脱敏,使得脱敏后的样本编号在多个业务数据源中保持一致,保留了多数据源中患者信息的可关联性,保障了后续分析任务中数据的丰富性。

20+数据库

支持MySQL、Oracle、MS SQLServer、ElasticSearch等关系型&非关系型20多种数据库

70+敏感数据识别算法

包括机器学习、NLP、文档指纹等先进AI技术创建识别规则、实体识别模型。包括复杂姓名、复姓、手机号、身份证、车牌号等

内置主流行业法规、保障数据合规

内置了包括网络安全法、金融、证券、电信、GDPR、CCPA、等保、数据安全法和个人信息安全规范等数十种法律法规

icon国内首家支持面向机器学习任务的脱敏算法(2/2) icon

某医疗单位的肿瘤样本数据交付给第三方研究机构进行数据分析,如何保障分析结果的前提下,不泄露敏感数据?二、样本特征:以肿瘤大小这一类数值类型特征为例,使用分布重建的脱敏算法,脱敏后的数据可保留原数据分布(图右),可保留各类常用统计特征(图左)。 三、样本标签:主要针对枚举类型的样本标签(图左),可使用保留类别频次特征算法,无需先验映射字典,自动根据标签分布对其进行编码,去除字段内容含义,仅保留类别区分性。对样本类别属性特征(如肿瘤颜色)也可使用该算法进行脱敏。 价值:面向机器学习的脱敏算法在剔除数据敏感性的同时最大程度保留了AI建模相关数据的可用性,即样本编号+样本特征+样本标签=高质量的AI模型

icon产品优势-其他脱敏算法优势举例icon
保留数值统计特征:标准化
应用场景:对数值类型的数据进行标准化缩放,使得数据均值归为0,方差归为1。本算法脱敏后的数据在高斯分布假设下基本保留数据分布类型,减少方差大的特征的影响,可后续用于常见的分类、聚类等数据分析任务,使模型更准确。 以收入为例,经过标准化处理后仅体现数据的分布及薪酬的相对大小,而无暴露原本收入。
计算关系保留算法
指定的列在脱敏后保留加法运算关系。可指定加数或被加数是否保留原值,否则会按照仿真算法重新生成。
身份信息关联保留算法
身份证&出生日期&性别保持一致, 脱敏后数据表间关联关系保持不变,原有数据逻辑保持不变,完全支持业务应用的数据使用和操作。
icon数据水印溯源icon
数据溯源系统的应用场景
场景:收集的数据需要向第三方或相关管理部门外发共享。风险:重要敏感数据外发后,存在由于目的部门管理不严造成的数据泄露风险。 外发数据被第三方泄漏后,无法追溯、定责、定损,造成失控局面。
数据泄露追踪新挑战
数据是谁的?(数据所有者)
数据是谁泄密?(责任方)
什么时间泄密?(泄密时间)
影响哪些单位?(影响范围)
icon水印溯源算法icon

脱敏水印算法适用场景:脱敏场景,对原数据保真无要求的场景

icon水印溯源算法icon

最小位修改算法适用场景:不能影响数据的业务含义,具有较强的业务使用/分析需求;隐蔽性要求高,避免被察觉添加水印

icon水印溯源算法icon

伪行算法适用场景: 不能修改原数据,不能影响业务逻辑; 使用环境较复杂,数据泄密风险较高,对内警示预防数据泄密

icon水印溯源算法icon

伪列算法适用场景: 不能修改原数据,不能影响统计分析结果

icon产品优势-可与分类分级平台对接icon

AiMask支持与分类分级产品(AiSort数据安全分级与风险评估系统)对接,可直接将分类分级结果进行复用,用户可利用分类分级结果灵活定制脱敏策略。

icon三权分立icon

三权分立,杜绝内控风险。内置标准用户角色,开箱即用。支持角色自定义,可对权限自由组合配置。

系统管理员
用户管理、安全配置、系统升级、许可证管理等
安全管理员
所有安全相关业务功能:数据源管理、敏感数据发现、脱敏任务管理、脱敏配置
审计管理员
对系统管理员和安全管理员的操作进行审计
icon部署方式icon
icon应用场景icon

针对各种不同场景,灵活配置脱敏算法,应对不同需求

icon案例:温州市“城市大脑”数据中心icon
数据安全平台安全能力分工
AiSort:数据分级与编目系统,对接编目系统传递编目数据给分级工具,分级工具输出分级建议信息。
AiMask:脱敏工具,与数据目录、数据交换平台对接打通,实现异构数据之间的脱敏交换。 用户登录中心:实现对业务系统的访问请求进行身份认证和统一管理,单点登录。
API安全代理:实现对API精细化到用户账号层的监控,阻断未经过授权的访问。
AiThink:用户与实体分析系统,监控业务行为,判断其是否存在异常。
数据透明加密:业务系统数据传输到数据库中,通过加解密系统自动加密。
icon案例背景-某国有企业icon

隶属某市人民政府的国有企业,主要涉及房地产、投资、金融等行业,客户高度重视安全问题。

数据脱敏
开发、测试环境使用未脱敏的生产数据
数据溯源
分发数据泄露无法溯源
产品推荐 查看更多>>
    阿里云 数据安全中心DSC

    数据安全中心DSC(Data Security Center),在满足等保2.0“安全审计”及“个人信息保护”的合规要求的基础上,为您提供敏感数据识别、数据安全审计、数据脱敏、智能异常检测等数据安全能力,形成一体化的数据安全解决方案。

    满足等保2.0对云计算环境下安全审计及个人信息保护的要求

    支持对接云上多种数据源,提供一体化的数据保护和防御机制

    无需部署代理agent,不占用租户资源

    精准识别与分类分级云上数据

    McAfee 应用程序控件

    McAfee 应用程序控件 能够在服务器、公司台式机和固定功能设备上阻止未经授权的可执行文件。实时行为分析技术和终端 自动免疫,可立即阻止持久性威胁,无需进行耗工耗时的列表管理或签名更新。

    安全可靠

    功能完备

    天锐绿盾数据防泄密系统

    是一套从源头上保障数据安全和使用安全的软件系统。包含了文件透明加解密、内部文件流转、密级管控、离线管理、文件外发管理、灵活的审批流程、工作模式切换、服务器白名单等功能,并全面覆盖Mac、Windows、Linux系统。从根本上严防信息外泄,保障信息安全。

    高效稳定

    安全可靠