脱敏操作流程化:自动发现敏感数据:采用数据字典、正则表达式等方式,自动发现数据库中存储敏感数据的数据对象。
分布式运算引擎,便于任务分布式运行,充分调动各个节点资源,保证脱敏效率。同时增强任务的容错能力。
命名实体识别(Named Entities Recognition, NER)是自然语言处理(NLP)的一个分支,其目的是识别语料中人名、地名等命名实体。由于这些命名实体数量不断增加,通常不可能在词典中穷尽列出(通常产品识别姓名通过字典枚举的方式,识别广度与精度受限于字典中姓,名的枚举个数),所以需要命名实体识别来自动学习其构成方法中的一些规律性。产品内置基于深度学习+条件随机场算法的(BiLSTM+CRF)命名实体识别模型,可准确识别人名、地名、机构名称、时间、日期、金额等各类实体内容 。在如下产品截图中,要进行保留姓,对名进行仿真脱敏,利用NER算法,能准确将“诸” 和“诸葛”这两个姓给识别出来,从而保证脱敏效果符合预期。
某医疗单位的肿瘤样本数据交付给第三方研究机构进行数据分析,如何保障分析结果的前提下,不泄露敏感数据?一、样本编号:使用一致性关联算法,对样本编号(图中身份证号)进行脱敏,使得脱敏后的样本编号在多个业务数据源中保持一致,保留了多数据源中患者信息的可关联性,保障了后续分析任务中数据的丰富性。
某医疗单位的肿瘤样本数据交付给第三方研究机构进行数据分析,如何保障分析结果的前提下,不泄露敏感数据?二、样本特征:以肿瘤大小这一类数值类型特征为例,使用分布重建的脱敏算法,脱敏后的数据可保留原数据分布(图右),可保留各类常用统计特征(图左)。 三、样本标签:主要针对枚举类型的样本标签(图左),可使用保留类别频次特征算法,无需先验映射字典,自动根据标签分布对其进行编码,去除字段内容含义,仅保留类别区分性。对样本类别属性特征(如肿瘤颜色)也可使用该算法进行脱敏。 价值:面向机器学习的脱敏算法在剔除数据敏感性的同时最大程度保留了AI建模相关数据的可用性,即样本编号+样本特征+样本标签=高质量的AI模型
脱敏水印算法适用场景:脱敏场景,对原数据保真无要求的场景
最小位修改算法适用场景:不能影响数据的业务含义,具有较强的业务使用/分析需求;隐蔽性要求高,避免被察觉添加水印
伪行算法适用场景: 不能修改原数据,不能影响业务逻辑; 使用环境较复杂,数据泄密风险较高,对内警示预防数据泄密
伪列算法适用场景: 不能修改原数据,不能影响统计分析结果
AiMask支持与分类分级产品(AiSort数据安全分级与风险评估系统)对接,可直接将分类分级结果进行复用,用户可利用分类分级结果灵活定制脱敏策略。
三权分立,杜绝内控风险。内置标准用户角色,开箱即用。支持角色自定义,可对权限自由组合配置。
针对各种不同场景,灵活配置脱敏算法,应对不同需求
隶属某市人民政府的国有企业,主要涉及房地产、投资、金融等行业,客户高度重视安全问题。
数据安全中心DSC(Data Security Center),在满足等保2.0“安全审计”及“个人信息保护”的合规要求的基础上,为您提供敏感数据识别、数据安全审计、数据脱敏、智能异常检测等数据安全能力,形成一体化的数据安全解决方案。
满足等保2.0对云计算环境下安全审计及个人信息保护的要求
支持对接云上多种数据源,提供一体化的数据保护和防御机制
无需部署代理agent,不占用租户资源
精准识别与分类分级云上数据
McAfee 应用程序控件 能够在服务器、公司台式机和固定功能设备上阻止未经授权的可执行文件。实时行为分析技术和终端 自动免疫,可立即阻止持久性威胁,无需进行耗工耗时的列表管理或签名更新。
安全可靠
功能完备
是一套从源头上保障数据安全和使用安全的软件系统。包含了文件透明加解密、内部文件流转、密级管控、离线管理、文件外发管理、灵活的审批流程、工作模式切换、服务器白名单等功能,并全面覆盖Mac、Windows、Linux系统。从根本上严防信息外泄,保障信息安全。
高效稳定
安全可靠