依图科技语音文字图像内容审核系统_保障平台内容安全抵御企业违规风险-云巴巴 -云巴巴

立即咨询

立即试用

商务合作

依图科技语音文字图像内容审核系统

围绕音视频图文业务场景，可对接一体化解决方案。音视频审核多维度检测，规范主播用户行为规范，降低违规风险。自定义过滤条件规则，黑白名单；自定义平台特定目标类别和关键词；多层级标签目录，细分识别返回。

立即咨询

我们的产品和能力

依图内容监管体系

场景化解决方案

场景化：围绕音视频图文业务场景，可对接一体化解决方案。

多维度：音视频审核多维度检测，规范主播用户行为规范，降低违规风险。

定制化：自定义过滤条件规则，黑白名单；自定义平台特定目标类别和关键词；多层级标签目录，细分识别返回。

语音业务场景-特点：场景较为复杂，违规内容隐蔽 icon

语聊房为例的审核流程 icon

依图语音算法能力

语音审核的难点

机器听不清：互联网语音场景常伴有强背景音、语速快、咬字不清、口音严重等情况，相比普通场景，语音识别难度倍增。机器听不懂：涉政、色情、辱骂等违规音频表达变化多端、内容隐晦，对语义理解的要求极高。机器分不开：呻吟、娇喘等色情内容容易混杂在对话、歌声甚至背景音当中，声纹特征细微，难鉴别，需要极强的声纹识别能力。

依图怎么解

语音识别:依图大幅刷新全球最大开源数据库AISHELL-2字错率（CER）记录，为迄今业内最低，比原领先者提升约20%。自然语言理解:依图NLP成果荣登Nature Medicine，这是该期刊全球首次刊发中文NLP在医疗诊断领域的研究成果。声纹识别:依图获VoxSRC世界声纹挑战赛冠军，并首次将EER（等错误率）记录刷新至1%以内。

SpeechIO测试 30个场景，依图26个第一 icon

复杂场景下的语音转写 icon

在10万个音频中精准识别目标人说话 icon

测试背景：

在十万个音频中夹杂

2段真实领导人发言

1段TTS合成音频

通过声纹进行查找

测试结果：

机器返回4段音频，其中

3段命中

1段为误报

语音场景下的审核效果 icon

图像业务场景-涉及类型众多并会更新 icon

图片精细化审核覆盖程度 icon

依图的图像算法能力

图像审核的难点

机器不认识:图片社区中，人脸图片信息多，政治人物、国外势力、劣迹艺人等，就算是清晰的照片，机器也很难认识谁是谁。机器看不清：像素低、光照、遮挡、变形图片多，机器无法精准分辨出图片内容。覆盖场景不全：传统的审核企业受困于数据不全，审核场景覆盖有限。算法迭代周期慢。

依图怎么解

人脸覆盖：18亿人像数据库，构建了全球最大的国家级人像数据库。图像识别：全球人脸识别工业界黄金标准美国国家标准技术局NIST连续两年三次获得比赛冠军。数据建设：依图有着全球领先的算法技术，迭代速度快，多年大量数据积累，每类违规几百万以上数据。最新自研改进的transformer算法，针对互联网场景做了大规模优化。

部分算法审核结果展示 icon

黑白图片、跨越年龄、低像素特征、黑白漫图、低明度色情等等都是图片审核的难点，但是依图依然表现良好。