低功耗 | 小型化 | 持续监听 | 复杂场景抗噪 | 近场交互
语音应用:盲人/聋哑人应用、智能场景识别、自定义唤醒、语音解锁密码、与可穿戴设备联动、全双工人机对话、语音转文本、方言与翻译、语音+图像识物。
低功耗自定义唤醒: 1. 唤醒模型大小:75k 2. 流程:手机端设定唤醒词,检查唤醒词合规性并计算阈值,开始声纹注册, 注册成功后将唤醒模型与声纹模型load到一级ADSP上 3. 测试场景:安静场景、家居场景。
背景:不再拘束于唤醒词,提供更自然的语音交互能力。在我们的日常生活中,不会和别人说话时每说一句话就叫对方名字一次,同样每次使用语音功能时都需要先呼叫车机的小名,有时真的会感觉心累;
使用场景:全局生效或者在应用内生效,如拍照摄影、游戏控制、音乐播控;
案例:
1. VIVO手机:拍照命令控制(拍照、茄子、Cheese)
2. 黑鲨手机:游戏控制命令词(打雷打雷、打药打药……)
3. 小米手机:来电控制命令词(接听电话、挂断电话)
4. 耳机:音乐播控命令词(增大音量、减小音量、上一首、下一首、播放音乐、暂停播放)
5. 手表:常用变盘操作指令(常用设置、运动设置、闹钟提醒……)
优势:
1. 资源占用低
2. 响应速度快
3. 准确率高
小米手机: 支持接打电话、控制APP 可定义VIVO手机: 通过声控控制拍照,包括中文和英文 分别是:拍照、茄子、Cheese。
主要由三个部分组成:回声消除、语音降噪、自动增益控制。 1. 回声消除采用传统控制和深度神经网络相结合的方案消除线性回声和非线性回声,能够在单讲 回声消除干净的情况下尽可能保留双讲人声。 2. 语音降噪部分利用麦克风阵列技术选取主要方向人声,再利用神经网络模型进行语音降噪,所 使用的网络模型包含了绝大多数会议场景噪声,如小会议室、大会议室、嘈杂办公室等等。 3. 自动增益控制是为了保证人声不会因为人与设备之间的距离增加而产生明显的音量变化。
思必驰手机音频解决方案可以盲人/聋哑人应用、智能场景识别、自定义唤醒、语音解锁密码、与可穿戴设备联动、全双工人机对话、语音转文本、方言与翻译、语音+图像识物,以及不再拘束于唤醒词,提供更自然的语音交互能力。在我们的日常生活中,不会和别人说话时每说一句话就叫对方名字一次,全局生效或者在应用内生效,如拍照摄影、游戏控制、音乐播控。
低功耗唤醒与多级校验
自定义唤醒
免唤醒命令控制
场景识别与声音事件检测
腾讯云小微智能硬件 AI 语音助手(Intelligent Hardware AI Voice Assistant,IHAVA)为您提供前沿的 AI 语音全链路能力、硬件方案咨询及认证服务,整合腾讯系优质内容和服务,面向智能硬件行业打造全方位的自然人机交互体验。
提供前沿的 AI 语音全链路能力
硬件方案咨询及认证服务
整合腾讯系优质内容和服务
面向智能硬件行业打造全方位的自然人机交互体验
魔音工坊AI配音平台拥有全能创新的音频合成编辑功能,成熟的应用商店能够南腔北调,语种多样以及情感合成,情绪多变。同时网页、小程序和APP,一个账户,多端通用,是短视频AI配音行业第一品牌。
全能创新音频合成编辑功能
丰富的声音IP
一个账户多端通用
成熟应用商店