近三年累计获得30余项世界冠军,在语音、图像、认知领域关键核心技术持续保持创新引领。
2020年CHiME-6再次以显著优势获得冠军,大幅刷新了该项赛事历史最好成绩。面向万物互联时代语音交互等真实场景下的语音识别任务,通过算法创新将错误率从46.1%降低到30.5%。
科大讯飞自2006年参赛以来一直蝉联冠军,历届比赛语种包括英文、中文、印地语
将文字信息转化为声音信息,让应用具备离线/在线语音合成的能力,提供众多有特色的发音人(音库)供选择。
2019年8月,科大讯飞“新一代语音翻译关键技术及系统” 荣获世界人工智能大会权威的SAIL应用奖
通过讯飞语音识别技术,精准命中调度指令,结合NLP语义理解,将文本信息转换成机器指令传入系统,进行具体事项操作,同时还可以加入TTS语音合成技术,在执行指令时,进行状态播报,以达到人机交互,准确把控指令操作。
灵活定义命令词 支持加载万条以上命令词
腾讯云小微智能硬件 AI 语音助手(Intelligent Hardware AI Voice Assistant,IHAVA)为您提供前沿的 AI 语音全链路能力、硬件方案咨询及认证服务,整合腾讯系优质内容和服务,面向智能硬件行业打造全方位的自然人机交互体验。
提供前沿的 AI 语音全链路能力
硬件方案咨询及认证服务
整合腾讯系优质内容和服务
面向智能硬件行业打造全方位的自然人机交互体验
语音合成(TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
合成语音拟真度高,能够符合多样的应用场景
语音合成支持中文、英文、粤语、四川话,也可以合成中英混读语音
支持多种男声、女声的选择,使得音色能够覆盖多样化的应用场景
支持电话、移动 App 等多种场景和合成效果选择。
魔音工坊AI配音平台拥有全能创新的音频合成编辑功能,成熟的应用商店能够南腔北调,语种多样以及情感合成,情绪多变。同时网页、小程序和APP,一个账户,多端通用,是短视频AI配音行业第一品牌。
全能创新音频合成编辑功能
丰富的声音IP
一个账户多端通用
成熟应用商店