技术专利
互联网技术领域
公开号: CN107610708A
标题:识别声纹的方法及设备
摘要:本发明提供了一种识别声纹的方法及设备。该方法包括:建立并训练通用识别模型,所述通用识别模型用于表示预设通信媒介下语音特征的分布;获取所述预设通信媒介下的语音数据;根据所述语音数据构建对应的所述声纹向量;根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。本发明通过构建和训练通用识别模型对语音数据进行处理,得到对应的声纹向量,从而确定声纹特征,并根据声纹特征识别发出声音的人,由于通用识别模型不限制声音的内容,因此使本声纹识别的使用比较灵活,增多了声纹识别的使用场景。
身份技术领域
公开号:CN107610707A
标题:一种声纹识别方法及装置
摘要:提供了一种声纹识别方法及装置。包括:对输入的语音进行预处理,获取语音中的有效语音;提取语音的MFCC声学特征,输出包含MFCC维度及语音分帧数的第一和第二特征矩阵;构建长短时递归神经网络模型,并将第一特征矩阵作为输入;利用神经网络模型的训练参数及语音的说话人特征训练特征提取矩阵,每个特征提取矩阵对应一个说话人模型;选取出匹配第二特征矩阵的说话人模型,所述匹配的说话人模型对应的说话人输出为声纹识别结果。本发明采用监督学习的方式来训练声纹背景模型,能够从训练语音中挖掘出更合适的声学特征,从而能够更准确地辨别说话人的差异性特征,学习到鲁棒性更强的说话人模型,获取更好的声纹识别效果。
通用技术领域
公开号:CN106847292A
标题:声纹识别方法及装置
摘要:一种声纹识别方法及装置。该声纹识别方法包括:客户端采集用户的测试语音,并向后台服务器发送语音识别请求,语音识别请求包括用户ID和所述测试语音;后台服务器接收语音识别请求,采用消息队列和异步机制确定待处理语音识别请求;后台服务器获取与待处理语音识别请求的用户ID相对应的目标声纹特征,并获取与待处理语音识别请求的测试语音相对应的测试声纹特征;后台服务器根据述目标声纹特征和测试声纹特征判断是否对应同一用户,并向客户端输出判断结果;客户端接收并显示判断结果。本发明所提供的声纹识别方法及装置,可达到快速语音识别效果,提高语音识别效率。
技术原理
基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、五官定位、人脸搜索、人脸比对、人脸验证、人员查重、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。
基于腾讯优图强大的面部分析技术
精准实时的人脸检测、分析、识别等服务
在线、离线满足多样需求
用户在来画数字人编辑器中生成或上传专属3D数字人形象后,即可自行在来画动画编辑器中的海量动画视频模板中一键调用3D数字人形象,生成融入数字人形象的动画视频;或导出数字人模型文件,委托来画创意制作团队进行数字人动画视频制作(高端定制),数字人动画可广泛用于品牌营销、城市宣传、产品代言、文旅宣传等各类场景。
创始人IP
数字员工IP
产品拟人化IP
虚拟偶像IP