icon核心技术先进性助力多领域保持业界领先水平icon

近三年累计获得30余项世界冠军,在语音、图像、认知领域关键核心技术持续保持创新引领。

icon国际权威语音识别比赛CHiME 2016-2020三连冠icon

2020年CHiME-6再次以显著优势获得冠军,大幅刷新了该项赛事历史最好成绩。面向万物互联时代语音交互等真实场景下的语音识别任务,通过算法创新将错误率从46.1%降低到30.5%。

icon语音识别 – 方言识别icon
icon语音识别 - 多语种识别icon
在线听写
适用于人机近场交互场景,例如输入法场景
当前共具备59种语言能力
语音转写
适用于人人交互场景,例如演讲、采访
当前,共具备5种语言能力,具体参数如右图
icon国际权威语音合成比赛Blizzard Challenge 2017-2019三连冠icon

科大讯飞自2006年参赛以来一直蝉联冠军,历届比赛语种包括英文、中文、印地语

icon语音合成-清晰的嘴巴icon
 
中文自然度超过4.5分,逼真效果足以媲美真人
英文自然度超过4.2分,连续14年蝉联国际英文语音合成大赛冠军
方言多语种平均4.0分,全面覆盖世界28个主要语种和语言
icon语音合成 - 多语种icon
M0S>4.0
英语、日语、维语
M0S>3.8
韩语、法语、西班牙语、德语、俄语、葡语、意大利语
M0S>3.5
泰、印地、保加利亚、藏语
M0S>3.0
瑞典、马来、波兰、越南、泰米尔、菲律宾、孟加拉、乌尔都、土耳其、阿拉伯10个语种
icon语音合成全面升级icon

将文字信息转化为声音信息,让应用具备离线/在线语音合成的能力,提供众多有特色的发音人(音库)供选择。

icon机器翻译icon

2019年8月,科大讯飞“新一代语音翻译关键技术及系统” 荣获世界人工智能大会权威的SAIL应用奖

icon机器翻译icon
icon语音调度系统概述icon

通过讯飞语音识别技术,精准命中调度指令,结合NLP语义理解,将文本信息转换成机器指令传入系统,进行具体事项操作,同时还可以加入TTS语音合成技术,在执行指令时,进行状态播报,以达到人机交互,准确把控指令操作。

icon语音调度系统技术优势icon
实现高精度识别用户语音并转写成文字或意图
科大讯飞拥有先进的语音识别技术,识别技术已在各个行业成熟应用
开放式接口,便于与各个应用系统进行集成
支持Window、Linux、Android、java和iOS平台
丰富的自定义语义技能与通用实体
支持庞大规模的用户自定义技能,匹配更多应用场景
预置地名、机场、车站、景区等多样实体,便于直接调用
部署、集成方式灵活多样
提供服务托管、私有化集成
icon语音调度系统架构icon
icon语音调度系统物理架构icon
icon语音调度系统示意图icon
icon语音调度系统接口流程图icon
icon命令词-语法文件icon

灵活定义命令词 支持加载万条以上命令词

icon命令词-优势icon
识别率高
领先的语音识别技术,识别率已超过96%。
误识别率低
低于千分之五的误识别率。
语种
支持中文、英文、日语等语种自。
串扰率低
低于3%的串扰率。
icon指挥中心/城运中心icon
全程语音控制系统
语音控制可视化大屏幕、监控搜索查看、警力搜索查看、警情流程信息、应急预案查看、通讯录搜索查看。
全程语音处置警情
语音指令快速打开警情详情、搜索周边警力及监控、快速调派警力、快速发布处置指令、快速协调部门联合作战。
语音快速作战部署
警力部署、警力调派、应急指挥等只需要一句话就可以完成系统与作战现场关联运行。
icon工厂港口监控调度icon
语音调取场地运行状态信息
通过语音调取电力、水位、温度,化繁为简,随时监控场地运行相关信息。
语音调取重点设备点位
通过语音调取重点设备、卡口点位,以及相应的巡更计划、处置计划等。
语音处理告警、异常信息
通过语音查阅运行系统当前存在的告警、异常信息,并通过语音进行记录、处置以及关闭等操作。
语音调取监控画面
通过随时调取需要查阅的监控图像,并能对图形进行放大、缩小等操作。
icon企业楼盘讲解icon
楼盘信息介绍
通过售楼顾问语音指令,进行楼盘亮点介绍、周边区位、购房须知介绍等相关信息,实时展示相关信息,加深购房者影响,增强讲解效果。
语音辅助3D展示
通过售楼顾问语音指令,动态展示房型、样板间等3D画面,无需其他人辅助,并可实现图像放大、缩小以及旋转操作,增强购房者购买意向。
iconAR眼镜-命令词控制icon
iconAR眼镜-命令词控制icon
icon中车控制-命令词控制icon
产品推荐 查看更多>>
    腾讯云小微智能硬件AI语音助手IHAVA

    腾讯云小微智能硬件 AI 语音助手(Intelligent Hardware AI Voice Assistant,IHAVA)为您提供前沿的 AI 语音全链路能力、硬件方案咨询及认证服务,整合腾讯系优质内容和服务,面向智能硬件行业打造全方位的自然人机交互体验。

    提供前沿的 AI 语音全链路能力

    硬件方案咨询及认证服务

    整合腾讯系优质内容和服务

    面向智能硬件行业打造全方位的自然人机交互体验

    腾讯云语音合成TTS

    语音合成(TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。

    合成语音拟真度高,能够符合多样的应用场景

    语音合成支持中文、英文、粤语、四川话,也可以合成中英混读语音

    支持多种男声、女声的选择,使得音色能够覆盖多样化的应用场景

    支持电话、移动 App 等多种场景和合成效果选择。

    魔音工坊AI配音平台

    魔音工坊AI配音平台拥有全能创新的音频合成编辑功能,成熟的应用商店能够南腔北调,语种多样以及情感合成,情绪多变。同时网页、小程序和APP,一个账户,多端通用,是短视频AI配音行业第一品牌。

    全能创新音频合成编辑功能

    丰富的声音IP

    一个账户多端通用

    成熟应用商店