安恒AiMask数据静态脱敏_全方位敏感数据保护解决方案-云巴巴 -云巴巴

安恒AiMask数据静态脱敏

安恒AiMask数据静态脱敏，国内首家支持面向机器学习任务的脱敏算法，满足数据统计分析，AI建模等需求。覆盖金融、政府、电信、医疗、教育等行业，分布式运算引擎，便于任务分布式运行，充分调动各个节点资源，保证脱敏效率。同时增强任务的容错能力。

立即咨询

V2.0-平台化脱敏 icon

脱敏操作流程化：自动发现敏感数据：采用数据字典、正则表达式等方式，自动发现数据库中存储敏感数据的数据对象。

数据发现
内置发现规则

自定义发现规则

抽样发现

确定脱敏范围
选定数据对象

设置数据子集

数据关联和切片

确定脱敏策略
基于数据类型配置脱敏算法

基于数据对象配置脱敏算法

执行脱敏任务
任务执行配置

执行状态监控

任务日志

V3.0-智能脱敏

智能发现

基于NER的智能识别算法，以及智能随机采样，能有效去除脏数据，使得敏感数据识别更准确。

智能抽取

可调的批处理量值，基于时间戳、主键、分区等过滤条件的自动并行抽取，提高抽取销量。

智能脱敏

保留数值统计特征脱敏，身份信息关联脱敏；任务定期执行；断点续传；智能异常处理；脱敏报表。

产品架构

分布式运算引擎，便于任务分布式运行，充分调动各个节点资源，保证脱敏效率。同时增强任务的容错能力。

数据静态脱敏系统重要特性 icon

丰富数据源
关系型数据库

大数据组件

数据仓库

数据文件

智能赋能
敏感数据发现

数据关系保持

保证数据一致性

脏数据处理

灵活的脱敏方式
数据库到数据库、数据库到文件、文件到数据库、文件到文件

自动化管理
脱敏任务定期执行；断点续传；高度容错；源表的主键、索引、唯一约束自动同步迁移

预置丰富算法
置空、乱序、遮蔽、分割、替换、取整、哈希、仿真、密码学、编码、保留数值统计特征、关联关系保留、溯源算法

产品优势-领先的算法 icon

行业领先的敏感字段识别算法

开箱即用70多种通用敏感字段识别算法。支持丰富的敏感数据识别技术：包括正则表达式、关键字典、机器学习、NLP、文档指纹等先进AI技术创建识别规则、实体识别模型。数据采样采用全局随机采样的方式，有效避免了脏数据的干扰。包括但不限于姓名、性别、手机号、固定电话、邮箱、民族、血型、学历、政治面貌、婚姻状况、身份证、车牌号、车架号、护照号、台胞证、港澳通行证、军官证、银行卡、驾驶证编号、机构名称、纳税识别号、组织机构代码、营业执照号码、统一社会信用代码、MAC地址、URL地址、MEID、IMEI、IP地址、IPv6地址、JDBC连接串、邮政编码、城市、省份、详细地址、日期、时间、基金代码、股票代码、基金名称、股票名称等。同时，客户可以根据自身业务需求自定义新增数据识别规则。

产品优势-引入NLP算法 icon

命名实体识别(Named Entities Recognition, NER)是自然语言处理(NLP)的一个分支，其目的是识别语料中人名、地名等命名实体。由于这些命名实体数量不断增加，通常不可能在词典中穷尽列出（通常产品识别姓名通过字典枚举的方式，识别广度与精度受限于字典中姓，名的枚举个数），所以需要命名实体识别来自动学习其构成方法中的一些规律性。产品内置基于深度学习+条件随机场算法的（BiLSTM+CRF）命名实体识别模型，可准确识别人名、地名、机构名称、时间、日期、金额等各类实体内容。在如下产品截图中，要进行保留姓，对名进行仿真脱敏，利用NER算法，能准确将“诸” 和“诸葛”这两个姓给识别出来，从而保证脱敏效果符合预期。

产品优势-数据智能识别 icon

产品优势-丰富的优势算法 icon

独有敏感字段发现规则

url、jdbc、imei、民族、血型、学历、政治面貌、婚姻状况、国籍编码、邮政编码、加密数据

独有脱敏算法

保留数学特征算法：标准化、归一化、添加噪声、保留频次特征、平均、分布重建、计算关系关联保留、身份信息关联保留、乱序关联保留

国内首家支持面向机器学习任务的脱敏算法（1/2) icon

某医疗单位的肿瘤样本数据交付给第三方研究机构进行数据分析，如何保障分析结果的前提下，不泄露敏感数据？一、样本编号：使用一致性关联算法，对样本编号（图中身份证号）进行脱敏，使得脱敏后的样本编号在多个业务数据源中保持一致，保留了多数据源中患者信息的可关联性，保障了后续分析任务中数据的丰富性。

20+数据库

支持MySQL、Oracle、MS SQLServer、ElasticSearch等关系型&非关系型20多种数据库

70+敏感数据识别算法

包括机器学习、NLP、文档指纹等先进AI技术创建识别规则、实体识别模型。包括复杂姓名、复姓、手机号、身份证、车牌号等

内置主流行业法规、保障数据合规

内置了包括网络安全法、金融、证券、电信、GDPR、CCPA、等保、数据安全法和个人信息安全规范等数十种法律法规

国内首家支持面向机器学习任务的脱敏算法（2/2) icon

某医疗单位的肿瘤样本数据交付给第三方研究机构进行数据分析，如何保障分析结果的前提下，不泄露敏感数据？二、样本特征：以肿瘤大小这一类数值类型特征为例，使用分布重建的脱敏算法，脱敏后的数据可保留原数据分布（图右），可保留各类常用统计特征（图左）。三、样本标签：主要针对枚举类型的样本标签（图左），可使用保留类别频次特征算法，无需先验映射字典，自动根据标签分布对其进行编码，去除字段内容含义，仅保留类别区分性。对样本类别属性特征（如肿瘤颜色）也可使用该算法进行脱敏。价值：面向机器学习的脱敏算法在剔除数据敏感性的同时最大程度保留了AI建模相关数据的可用性，即样本编号+样本特征+样本标签=高质量的AI模型

产品优势-其他脱敏算法优势举例 icon

保留数值统计特征：标准化

应用场景：对数值类型的数据进行标准化缩放，使得数据均值归为0，方差归为1。本算法脱敏后的数据在高斯分布假设下基本保留数据分布类型，减少方差大的特征的影响，可后续用于常见的分类、聚类等数据分析任务，使模型更准确。以收入为例，经过标准化处理后仅体现数据的分布及薪酬的相对大小，而无暴露原本收入。

计算关系保留算法

指定的列在脱敏后保留加法运算关系。可指定加数或被加数是否保留原值，否则会按照仿真算法重新生成。

身份信息关联保留算法

身份证&出生日期&性别保持一致，脱敏后数据表间关联关系保持不变，原有数据逻辑保持不变，完全支持业务应用的数据使用和操作。

数据水印溯源

数据溯源系统的应用场景

场景：收集的数据需要向第三方或相关管理部门外发共享。风险：重要敏感数据外发后，存在由于目的部门管理不严造成的数据泄露风险。外发数据被第三方泄漏后，无法追溯、定责、定损，造成失控局面。

数据泄露追踪新挑战

数据是谁的?（数据所有者)

数据是谁泄密?（责任方)

什么时间泄密?（泄密时间)

影响哪些单位?（影响范围)

水印溯源算法

脱敏水印算法适用场景：脱敏场景，对原数据保真无要求的场景

水印溯源算法

最小位修改算法适用场景：不能影响数据的业务含义，具有较强的业务使用/分析需求；隐蔽性要求高，避免被察觉添加水印

水印溯源算法

伪行算法适用场景：不能修改原数据，不能影响业务逻辑；使用环境较复杂，数据泄密风险较高，对内警示预防数据泄密

水印溯源算法

伪列算法适用场景：不能修改原数据，不能影响统计分析结果

产品优势-可与分类分级平台对接 icon

AiMask支持与分类分级产品（AiSort数据安全分级与风险评估系统）对接，可直接将分类分级结果进行复用，用户可利用分类分级结果灵活定制脱敏策略。

三权分立

三权分立，杜绝内控风险。内置标准用户角色，开箱即用。支持角色自定义，可对权限自由组合配置。

系统管理员
用户管理、安全配置、系统升级、许可证管理等

安全管理员
所有安全相关业务功能：数据源管理、敏感数据发现、脱敏任务管理、脱敏配置

审计管理员
对系统管理员和安全管理员的操作进行审计

部署方式

应用场景

针对各种不同场景，灵活配置脱敏算法，应对不同需求

案例：温州市“城市大脑”数据中心 icon

数据安全平台安全能力分工

AiSort：数据分级与编目系统，对接编目系统传递编目数据给分级工具，分级工具输出分级建议信息。

AiMask：脱敏工具，与数据目录、数据交换平台对接打通，实现异构数据之间的脱敏交换。用户登录中心：实现对业务系统的访问请求进行身份认证和统一管理，单点登录。

API安全代理：实现对API精细化到用户账号层的监控，阻断未经过授权的访问。

AiThink：用户与实体分析系统，监控业务行为，判断其是否存在异常。

数据透明加密：业务系统数据传输到数据库中，通过加解密系统自动加密。

案例背景-某国有企业 icon

隶属某市人民政府的国有企业，主要涉及房地产、投资、金融等行业，客户高度重视安全问题。

数据脱敏

开发、测试环境使用未脱敏的生产数据

数据溯源

分发数据泄露无法溯源

产品推荐

元娲AI数字虚拟形象

元娲AI数字虚拟形象，自由化输入文本驱动虚拟人播报，一键合成虚拟形象声音实时播报，支持多国语言，虚拟主播国际化风格。提供私有化、公有云服务、SDK接口调用，AI虚拟主播系统、直播功能，AI智能交互功能，提供一体机整体解决方案。

免费试用

查看详情

阿里云NAT网关

阿里云NAT 网关（NAT Gateway）是一款企业级的地址转换网关，提供 NAT 代理（SNAT、DNAT）、跨可用区的容灾能力。公网NAT 网关与EIP、共享带宽包配合使用，可以组合成为高性能、配置灵活的企业级公网访问出入口网关，VPC NAT网关可与高速通道，CEN TR组合成为私网互访的私网访问出入口。

免费试用

查看详情

原圈科技精准广告投放管理平台

原圈科技精准广告投放管理平台，一键链接腾讯，抖音和百度三大主流公域平台的投放后台，投放结果数据自动同步，费效实时分析。同时支持通过模版导入安居客等垂类平台的投放意向客户线索，数据自动合并和对比。通过简单配置和开发，即可对接客户自有 CRM 系统，实现“投放 - 留电 - 到访 - 成交” 的实时绩效分析和实时预算分配建议。

免费试用

查看详情