腾讯云智聆口语评测SOE
智聆口语评测(Smart Oral Evaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,支持单词、句子、段落、自由说等多种模式,支持发音准确度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中文及英语口语类教学中。
全年龄段覆盖的中英文语音评测打分
支持字词、句子、段落等多种语音评测模式
支持发音准确度、流利度等全方位打分机制
可广泛应用于中文及英语口语类教学中
腾讯云声音工坊TTSW
腾讯云声音工坊( TTSW )提供定制音色的能力,满足客户定制化需求。通过先进的深度学习技术,根据客户实际业务情况,提供不同的定制方案,从而更有效、更专业地服务实际业务需求。普遍适用于智能客服、智能硬件、在线教育、有声阅读、新闻播报等场景,通过训练专属业务音色,从而更好的服务业务场景,提升交互体验。
基于业界领先的深度学习技术,专业算法人才进行效果调优
在多个行业、场景积累了大量的训练数据,有效降低客户的数据门槛
基于实际业务需求,提供不同程度的定制方案
广泛适用于智能客服、智能硬件、在线教育、有声阅读、新闻播报等也场景
腾讯云语音合成TTS
语音合成(TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
合成语音拟真度高,能够符合多样的应用场景
语音合成支持中文、英文、粤语、四川话,也可以合成中英混读语音
支持多种男声、女声的选择,使得音色能够覆盖多样化的应用场景
支持电话、移动 App 等多种场景和合成效果选择。
声纹识别(Voiceprint Recognition)也称说话人识别 (Speaker recognition),是根据人的声波特性进行身份辨识的服务。可以将说话人声纹信息与库中的已知用户声纹进行1:1比对验证和1:N的检索。
思必驰企业级会议麦克风音箱M12搭载2个8W高性能扬声器以及被动振膜低音单元和低音反射系统,带来极致的音频会议体验; 拾音时可同时放音,双向通话传输,与会者无缝交流。
思必驰M4降噪会议麦克风音箱实时通话降噪,3 米拾音距离会议记录更省时。培训讲师声音更清晰,培训录音文稿整理更便捷。随声录音、语音实时转文字,出稿更便捷。
思必驰AI转写麦克风音箱M6有6单元全向麦,4m有效拾音半径,6m最远拾音半径,发言人无需喊话,6米外也能清晰传音 。AI定向拾音,准确捕捉发言人的语音信息,避免周围环境噪音的干扰; 全双工通话,远程通话双向同步讲话,犹如面对面,提供高效沟通;AI加持音频算法,更好的智能降噪,更好的去混响,更好的人声增益。
出门问问TTS解决方案是从TTS端到端语音合成引擎,合成效果媲美真人,合成语音准确、流畅、自然,领先的韵律准确率,多音字准确率业界Top 1,覆盖喜/怒/哀/乐四个维度的情绪表达,情感强度控制,让合成语音更有温度感。优化端到端歌唱合成系统,输入乐谱(musicxml/midinode),输出歌曲音频。
爱小智是针对一些特定岗位(销售、导购、客服)日常话术学习和评测的人工智能工具。综合利用语音合成、语音识别、语音测评、语义理解等人工智能技术,模拟相关业务场景和角色,陪伴学员进行日常话术学习,并进行智慧的行为测评,具备自我学习能力。
思必驰语音语言解决方案集成了公司的全链路智能语音语言交互技术,同时具备支撑人工智能产品开发的大规模场景化定制能力, 可以快速搭建产品原型,并进行场景化、 个性化定制。从感知智能到认知智能,从信号处理到识别到理解到交互,思必驰拥有全面的智能语音语言交互技术。
思必驰胸牌质检软硬件解决方案70*25mm标准胸牌外观,洛可可ID设计, 高端商务质感,彰显职业形象; 服务过程自然拾音,避免对录音笔排斥心理; 相比普通录音笔薄50%,厚度仅7mm,重量小于20g,支持激光镭雕、打印背胶粘贴、镂空镍标等多种加工工艺制作铭牌,满足企业客户的品牌视觉识别体系要求。
思必驰智慧物联解决方案基于海量声学和文本数据,提供以任务型对话为主,兼具闲聊和问答的综合性对话服务。提供通用的内置技能;支持自定义对话逻辑和内容;细致到每一轮交互的超高度定制。
思必驰无线领夹麦解决方案成熟的声学结构设计指导说明,声学腔体仿真验证、丰富麦克风选型推荐和厂商,力求在产品前期ID设计阶段便可得到最佳腔体,节约您的人力、物力 & 时间成本,同时保证产品feature算法的最优化,深化产品的竞争力!
思必驰手机音频解决方案可以盲人/聋哑人应用、智能场景识别、自定义唤醒、语音解锁密码、与可穿戴设备联动、全双工人机对话、语音转文本、方言与翻译、语音+图像识物,以及不再拘束于唤醒词,提供更自然的语音交互能力。在我们的日常生活中,不会和别人说话时每说一句话就叫对方名字一次,全局生效或者在应用内生效,如拍照摄影、游戏控制、音乐播控。
思必驰平板音频解决方案核心算法基于传统信号处理+深度学习技术,结合麦克风阵列进行前端降噪,不受限于噪声类 型,覆盖低信噪比全场景,大幅提升通话清晰度,改善噪声环境下的通话质量.
思必驰耳机/眼镜/手表语音解决方案的智能降噪技术采用的是“两者兼融”的方式——传统分离结合深度学习方案,兼顾传统信号处理的保真性和深度学习的非稳态噪声抑制能力,即在很好的去除非稳态噪声的同时保证语音的较小失真,听感更自然。
魔音工坊AI配音平台拥有全能创新的音频合成编辑功能,成熟的应用商店能够南腔北调,语种多样以及情感合成,情绪多变。同时网页、小程序和APP,一个账户,多端通用,是短视频AI配音行业第一品牌。
依图科技实时长短语音转写,提供不超过60秒的语音识别服务,提供长达5小时的语音识别服务,支持中英混读,并且兼容多种口音。提供流式语音识别能力,一边接受音频数据,一边提供转写结果。
通过讯飞语音识别技术,精准命中调度指令,结合NLP语义理解,将文本信息转换成机器指令传入系统,进行具体事项操作,同时还可以加入TTS语音合成技术,在执行指令时,进行状态播报,以达到人机交互,准确把控指令操作。