立即咨询

电话咨询

微信咨询

立即试用
商务合作

腾讯云语音识别 ASR

腾讯云语音识别技术采用自主研发的Dual Path Attention Network(DPAN)模型,通过系统融合实现对语音信号高效的建模,在不同应用场景下,具备较好的鲁棒性。
立即咨询
icon产品功能icon
语种
中、英、粤、川、上海话、韩、日、泰、南昌、南京等23种方言,
陆续会支持更多方言及语种。
行业
通用、音视频、金融、法庭、医疗、游戏等领域。
接入方式
API、SDK、小程序插件。
子服务
实时语音识别,对实时音频流进行识别,“边说边出文字一句话识别,对60s之内的录音文件进行识别,半实时返回文字录音文件识别,对较大的录音文件进行识别,异步返回文字。
录音文件识别极速版,对较大的音频极速返回文字。
语音流异步识别,对直播流进行实时识别返回文字。
效果自调优
热词、自学习模型,用户通过添加特定名词、句篇,可显著提升专有词汇或句篇的识别准确率。

 

 

icon语言模型自训练平台icon
 
通用模型/行业模型
对于常用词汇或者句子的识别效果较好,但对一些特有的人名、地名或者某个领域的专有词汇或者句子识别效果可能不好。
自学习模型
自学习模型训练数据为用户在专有领域和行业积累的文本数据,可以有效提高文本场景下的语音识别准确率,一般一个客户配置一套即可。
热词
热词文本为特有的人名、地名或者某个领域的专有词汇并配以权重,可以有效提高文本中词汇的的识别准确率,一般一个客户会根据业务线不同每个业务线单独维护一套热词来使用。

 

icon语音识别准确率icon
 
 
业界领先
社交对话场景(非电话,带口音,口语化)。
97%+
实验室环境。
90%+
背景安静,近场,口语化,标准普通话场景下字准率。
85%~90%
背晨轻微噪音,近场,口语化,轻度口音场景下字准率。
 
icon语音识别产品优势icon

 

腾讯云语音识别技术采用自主研发的Dual Path Attention Network(DPAN)模型,通过共享端到端AED系统和Hybrid Conformer系统的Encoder,通过系统融合实现对语音信号高效的建模,在不同应用场景下,具备较好的鲁棒性。同时,根据业务需求,在DPAN框架下,实现了低延时的流式输出,以及在声音和文本层面的自适应能力。针对多语言混合场景,研发了混合语音识别模型,可支持单一模型识别国内20多个地区方言,以及单一型识别中英粤三个语种,极大方便了业务应用。

 
icon语音识别产品算法效果icon

16K(非电话) 场景: 整体识别准确率业界领先,基于微信、王者、腾讯自由强势产品积累数据持续打磨模型;

8K(电话)场景: Q2更新一版基于业界最领先技术的模型,整体识别准确率预计可以追齐友商。

 

icon语音识别产品时延效果icon

经过3.0专项打磨,在保证基本准确率的基础上,时延指标处于业界一流水平。

 

 

icon语音质检解决方案icon

 

 
使用场景:
·大型呼叫中心话务员日常工作评价。
业务痛点:
·人工处理速度慢,抽检覆盖率低。
· 标准不一:无法避免个人主观性影响。
·成本高:需要大量人力,且需要定期培训、抽查。
解决问题
·以统一的标准快速实现电话业务的全量质检。
 

 

 

icon语音质检 -- 携程客服呼叫中心icon
 
 
项目背景:携程拥有超过10000个坐席的呼叫中心,对呼叫中心员工的通话内容的质检是一个业务痛点和难点,影响到呼叫中心员工的工作评定和呼叫中心整体运营水平的提升
解决方案:录音文件识别
客户价值:大幅提升呼叫中心工作质量管控能力,完成人力不可能完成的超大规模呼叫中心的电话录音质检问题

 

icon语音客服 -- 中信银行智能客服icon
 
项目背景:中信银行有大量的客户咨询、投诉电话需要呼叫中心人工客服进行处理,人力成本极高,并且客服员工流动性大,导致服务质量不一致,培训成本也很高
解决方案:实时语音识别+BOT+语音合成
客户价值:大幅降低客户呼叫中心人力&培训成本,客服场景由机器人处理大部分重复性任务,由人工兜底剩余复杂业务。

 

 

icon语音敏感分析解决方案icon

高效识别各类场景的涉政、色情、娇喘、广告、辱骂、 歪唱国歌等违规内容提前防御内容风险,提高审核效率,净化网络环境,提升用户体验。

 
 
· 涉政语音识别
· 娇喘语音识别
· 辱骂语音识别
· 色情语音识别

 

icon直播质检 - 拼多多icon
 
 
项目背景:“直播带货”已经成为潮流,可以有效提升了消费者的消费体验,但同时对于直播的合法合规监控也成为一项必须要做的事情。

解决方案:录音文件识别极速版(音视频模型)。

客户价值:把商家在直播时主播的语音转为文字,再依靠后端语义的能力进行审核,可快速有效的完成对整个电商平台直播合法合规的监控与管理。

 

icon视频添加字幕 -- 美图秀秀icon
 
 
项目背景:在短视频领域,越来越多的公司不断发力,视频自动识别添加字幕是标准功能。

解决方案:公有云录音文件识别极速版(音视频模型)。

客户价值:语音识别能力准确,性能稳定,帮助美图秀秀顺利赶上短视频浪潮,也提升了用户活跃度

项目效果:腾讯云语音识别产品逐步成为美图集团全产品线共同的选择。

 

 

icon音视频标签 -- 喜马拉雅icon
 
 
项目背景:对于UGC音频内容,中长尾用户上传的材料,标签是缺失或错误的,无法做对应的内容挖掘及推荐。

解决方案:录音文件识别极速版(音视频模型)。

客户价值:依赖语音识别的能力,可以把语音转成文字,再依靠后端语义的能力形成内容标签,把中长尾用户的UGC内容整合入推荐系统。

 

icon语音输入法/语音弹幕icon
   
 
场景:在很多带交流功能的app中,语音输入是一项很方便和实用的功能,可极大缩短用户打字时间,提高交流效率。
解决方案:实时语音识别(iOS/Android SDK接入)
腾讯优势:
1、识别效果业界领先:微信、王者海量匹配场景的数据积累,准确率、识别时延、流畅度业界领先;
2、灵活后处理:增加用户的易用性;
3、支持高并发:在线识别服务支持数千路高并发且不针对并发路数增加收费;
4、接入成本低:在线+离线的iOS/Android SDK完备。
高潜客户:输入法app、在线教育、社交类app、团战类游戏app。
 

 

icon语音输入法 -- KK键盘icon
   
 
项目背景:语音输入法一致时语音识别的重要领域之一,北京义享科技打造的KK键盘致力于为年轻人提供娱乐性最强的语音输入法,不仅支持表情包、动图等趣味性高的能力,也支持语音输入转文字。
解决方案:实时语音识别(通用)。
客户价值:通过语音3.0专项的优化,目前腾讯云实时语音识别能力与精品相比处理领先位置,尤其是最重要的首字延迟上,1-1.2秒的延迟远超竟品,是客户选择腾讯云AI能力为服务的重要原因。
 
 

 

icon游戏语音--王者荣耀icon

 

 

icon游戏娱乐一站式语音解决方案icon
 
 
 
实现功能
· 游戏语音开黑
· 语音聊天室
· 语音直播
· 线上 K歌
语音技术支撑
· 实时语音对讲
· 多人连麦
· 语音消息及语音转文本

 

icon语音游戏 -- 你演我猜icon
 
 
 
项目背景:重庆米虫科技与腾讯云AI语音联合GME团队,为台北及东南亚地区开发你画我猜游戏,使用实时语音识别转文字。
解决方案:实时语音识别(通用)
客户价值:依赖高精准的语音识别能力,可以把语音快速,准确地转成文字,再依旱后端文本匹配的能力进行游戏推演语音识别能力是这个游戏的重要核心,优秀稳定的语音识别能力将客户日活从8万提升至20万,DUA增长超过149%。
icon应用场景&解决方案icon

 

 

 

icon客户案例集锦icon

 

 

产品推荐

威努特多云管理平台
威努特多云管理平台是面向混合IT,以多架构适配、多功能扩展、多环境支持为特性的云管理平台。为企业用户提供异构多集群纳管,增强网络互联特性,同时依托资源编排、云安全、云原生、云容灾等平台服务能力,助力企业IT运维人员对庞杂的数据中心软硬件设备、各类应用负载和复杂网络拓扑进行集中管理、统一运维,满足用户业务自助式交付、快速平稳运行、弹性扩缩容以及持续升级迭代的多元化需求。
免费试用
查看详情
腾讯云企点客服TQDCS
腾讯企点客服(TQDCS)是为销售和客服部门提供多渠道商机转化与客户服务的智能客服平台。以即时通讯、音视频、人工智能、大数据、云呼叫中心等技术帮助提升服务质量与客户忠诚度,以个性化服务和精准客户洞察撬动销售转化与复购增购,构建客户运营体系。极大提升了企业获客、待客、留客的效率,使客服部门从成本中心转变为利润中心。
免费试用
查看详情
诺云微信直播
诺云提供1对1全案直播服务,从前期方案策划到直播数据分析反馈,诺云致力于让企业通过直播降本增效,创造最大效益。多设备输入,多平台输出,满足各行各业推广需求, 让企业以最便捷的方式搭建专属的微信直播间。
免费试用
查看详情
中安威士数据资产管理系统
企业实现数据资产管理的基础服务平台,立足数据治理的起点和重要环节。以资产发现-资产梳理为核心,以资产可视-资产可管为目标,致力于提升企业对数据资产的整体管控能力和运维效率。
免费试用
查看详情