icon我们的产品和能力icon
icon依图内容监管体系icon
icon场景化解决方案icon
场景化:围绕音视频图文业务场景,可对接一体化解决方案。
多维度:音视频审核多维度检测,规范主播用户行为规范,降低违规风险。
定制化:自定义过滤条件规则,黑白名单;自定义平台特定目标类别和关键词;多层级标签目录,细分识别返回。
icon语音业务场景-特点:场景较为复杂,违规内容隐蔽icon
icon语聊房为例的审核流程icon
icon依图语音算法能力icon
语音审核的难点
机器听不清:互联网语音场景常伴有强背景音、语速快、咬字不清、口音严重等情况,相比普通场景,语音识别难度倍增。机器听不懂:涉政、色情、辱骂等违规音频表达变化多端、内容隐晦,对语义理解的要求极高。机器分不开:呻吟、娇喘等色情内容容易混杂在对话、歌声甚至背景音当中,声纹特征细微,难鉴别,需要极强的声纹识别能力。
依图怎么解
语音识别:依图大幅刷新全球最大开源数据库AISHELL-2字错率(CER)记录,为迄今业内最低,比原领先者提升约20%。自然语言理解:依图NLP成果荣登Nature Medicine,这是该期刊全球首次刊发中文NLP在医疗诊断领域的研究成果。声纹识别:依图获VoxSRC世界声纹挑战赛冠军,并首次将EER(等错误率)记录刷新至1%以内。
iconSpeechIO测试 30个场景,依图26个第一icon
icon复杂场景下的语音转写icon
icon在10万个音频中精准识别目标人说话icon
测试背景:
在十万个音频中夹杂
2段真实领导人发言
1段TTS合成音频
通过声纹进行查找
测试结果:
机器返回4段音频,其中
3段命中
1段为误报
icon语音场景下的审核效果icon
icon图像业务场景-涉及类型众多并会更新icon
icon图片精细化审核覆盖程度icon
icon依图的图像算法能力icon
图像审核的难点
机器不认识:图片社区中,人脸图片信息多,政治人物、国外势力、劣迹艺人等,就算是清晰的照片,机器也很难认识谁是谁。机器看不清:像素低、光照、遮挡、变形图片多,机器无法精准分辨出图片内容。覆盖场景不全:传统的审核企业受困于数据不全,审核场景覆盖有限。算法迭代周期慢。
依图怎么解
人脸覆盖:18亿人像数据库,构建了全球最大的国家级人像数据库。图像识别:全球人脸识别工业界黄金标准美国国家标准技术局NIST连续两年三次获得比赛冠军。数据建设:依图有着全球领先的算法技术,迭代速度快,多年大量数据积累,每类违规几百万以上数据。最新自研改进的transformer算法,针对互联网场景做了大规模优化。
icon部分算法审核结果展示icon

黑白图片、跨越年龄、低像素特征、黑白漫图、低明度色情等等都是图片审核的难点,但是依图依然表现良好。

icon文本业务场景icon
icon文本审核覆盖面icon
icon依图的文本检测能力icon
 
审核方式: 前沿的自然语言处理算法 海量的敏感关键词库建模
分类 色情、暴恐、邪教、广告、涉政、辱骂、灌水无意义
icon更聪明的文本识别能力icon
icon入选网信办典型应用案例icon
icon建立安全预警日历,精确到天的审核策略icon

依图深耕安全行业多年,对实事敏感,可以实时更新违禁数据库;高度关注法规政策,建立网络内容安全预警日历,拥有重点事项运营审核能力。

icon部分企业案例icon
产品推荐 查看更多>>