思必驰耳机/眼镜/手表语音解决方案_智能语音唤醒_智能语音识别系统-云巴巴 -云巴巴

立即咨询

立即试用

商务合作

思必驰耳机/眼镜/手表语音解决方案

思必驰耳机/眼镜/手表语音解决方案的智能降噪技术采用的是“两者兼融”的方式——传统分离结合深度学习方案，兼顾传统信号处理的保真性和深度学习的非稳态噪声抑制能力，即在很好的去除非稳态噪声的同时保证语音的较小失真，听感更自然。

立即咨询

可穿戴设备语音解决方案 icon

低功耗高性能 | 全场景降噪 | 差异化方案 | 一站式服务。

自适应通话降噪-让他/她听清你的声音 icon

多种麦克风阵列

近场麦克风阵列

单麦克风：硬件成本低，硅MIC SNR不低于65dB，硅MIC灵敏度波动范围在1dB以；

内双麦克风阵列：适配BF等传统降噪算法，间距覆盖15~35mm，单体要求与单麦一致；

三/四麦克风阵列：兼容双麦克风阵列优势，高噪场景，FB/VPU MIC音频可保证更好，ENC效果，Hybrid ANC，主动降噪，性能更强。

远场麦克风阵列

六麦克风阵列：环形/线型阵列，满足不同，产品封装要求，拾音距离远达8m；

灵敏度一致性：硅麦 ≤ ± 1.5dB ；驻极体 ≤ ± 2dB；

信噪比：硅麦 ≥ 63 dB；驻极体 ≥ 68 dB；

四麦克风阵列：环形/线型阵列，满足不同；产品封装要求，拾音距离远达5m，单体要求与六麦一致；

三麦克风阵列：可分离说话人内容（会议场景）；单体要求与四/六麦一致；

双麦克风阵列：拾音距离远达3m，单体要求与四/六麦一致。

耳机自适应通话降噪-三麦ENC 无惧风噪 icon

耳机自适应通话降噪-骨导ENC 降噪中的战斗机 icon

算法优势： 1. 骨导传感器提供的信号对高噪声场景（如运行的地铁、大风噪等）有着更好的消噪效果，通话无障碍； 2. 骨导传感器提供的音频能量集中在低频部分，通过算法DNN等调整校准，输出的处理音频人声保真度高，不显得人声过于发闷； 3. 通过融合FF & talk mic的信息（如果有FB mic，也会参考FB mic 信号），结合深度学习算法，对稳态与非稳态噪声消除好。

耳机自适应通话降噪-双麦ENC icon

耳机自适应通话降噪-单麦 icon

优秀的抗噪能力-无惧风噪/嘈杂环境/突发噪声 icon

风噪：跑步、骑行、车载嘈杂场景：地铁、酒吧、公交车、十字路口；突发噪声：汽车鸣笛、地铁开关门。

线性滤波与神经网络相结合的回声消除 icon

几种典型场景

单讲、双讲、听筒模式、免提模式；

效果影响因素

麦克风与喇叭的距离、参考音通道数、时延稳定性、回录方式、喇叭失真、是否有音效处理、保证清晰度、避免吞音、减小失真。

系统的3GPP客观测试方法 icon

完整的端到端测试保障主观听感和稳定性 icon

遍历所有的情况进行端到端测试并保存通话音频，将最终的音频上传至评测平台进行测试，保证用户的体验。

自研Mockup支撑硬件结构一体化设计 icon

评估与验证：对市面上的主流耳机进行定向测试、拆解，分析优劣势场景与设计初衷；自研mockup覆盖不同间距、不同防尘网、不同开孔方向、不同形状等；验证不同硬件与结构设计对算法的影响，完善参考设计并定向进行算法优化。

硬件结构设计对算法的影响模拟评估 icon

不同骨导元器件对比

通话降噪-方案优势

语音还原度高
1. 语音听感自然，失真度小

2. 同等芯片占用的算力更小

3. 提前适配很多的结构特征

声音平稳度高
1. 兼顾语音和背景降噪，

处理平滑，声音平稳自然

2. 各种通讯软件兼容

3. 各种佩戴方式兼顾

降噪深度高
1. 传统+神经网络结合

2. 环境自适应

3. 风噪、地铁场景降噪高达30db+

端到端的解决方案
1. 完整的端到端测试，

覆盖广泛用户使用用例

2. 端到端的测试工具支持

3. 硬件结构与算法一体化设计

智能场景检测—助力场景智 icon

场景	具体场景	延时要求
偏安静	安静的家居、安静的图书馆、安静的健身房	响应时间为3s，恢复时间为4s
中等噪声	嘈杂的会议室、办公室	响应时间为3s，恢复时间为4s
重度噪声	火车运行时、高峰期城市街道，高峰期购物中心	响应时间为3s，恢复时间为4s
风噪	弱风噪	风噪响应为3s以内，强风噪切换到弱风噪/无风状态在8s左右响应
风噪	强风噪	风噪响应为3s以内，强风噪切换到弱风噪/无风状态在8s左右响应
具体场景	地铁场景/非地铁场景、机场场景/非机场场景等

场景	具体场景	准确率
偏安静	安静的办公室、安静的家居、安静的会议室、安静的健身房	95%
中等噪声	高峰期的餐厅、咖啡厅	95%
重度噪声	高峰期的地铁站（内）、高铁站、公交车站	95%
风噪	骑行	98%

噪声场景检测实测数据 icon

本测试基于恒玄平台，测试环境为日常办公室场景，底噪约为50-60dB。

助听与辅听—自主验配 icon

助听与辅听—三大核心算法 icon

低功耗离线语音交互链路 icon

低功耗语音唤醒—— 一声轻唤，享你所想 icon

结合骨导信号降低他人误唤醒 icon

低功耗语音唤醒-唤醒率测试数据 icon

低功耗语音唤醒-唤醒率测试数据 icon

低功耗语音唤醒-方案优势与竞品对比 icon

低功耗领域覆盖率Top1
1. 手机领域：第三方算法覆盖率Top1 2. 教育平板：低功耗算法市占率Top1 3. 耳机：低功耗唤醒最早落地的语音厂商

丰富的芯片小型化适配经验
1. 算法模型小到30k，熟悉端到端联合优化 2. 熟悉各种硬件加速和优化指令集 3. 与多家芯片公司战略合作

唤醒率与误唤醒率综合TOP1
1. 手机领域：第三方算法覆盖率Top1 2. 教育平板：低功耗算法市占率Top1 3. 耳机：低功耗唤醒最早落地的语音厂商

全链路解决方案并持续升级
1. 提供结构设计、算法、集成全链路服务 2. 拥有完善的测试方案与工具支持 3. 方案不断升级，优化体验

离线多命令词控制 —“你尽管说” icon

离线多命令词控制 — 低资源占用，性能优秀 icon

Apollo3平台实测数据：备注：1580词，固定说法80词+不固定说法设置闹钟 1440词+不固定说法倒计时 60词 • 资源占用：RAM 55KB、Flash 160KB、算力45M • 误识别率：所有词一直启用的情况下，18h 10次 • 功耗：一直启用的情况下，1.14mA@5V。

离线多命令词控制 - 主要优势 icon

极低功耗，超长待机不依赖VAD，整体功耗接近1mA 一语触达，方便快捷免唤醒，抬腕唤醒，Oneshot，方式灵活离线可用，低资源占用不依赖网络，资源占用低，可快速集成自主编译，应用广泛，支持自主编译词组，快速生成资源。

离线语音播报-主要优势 icon

云端能力扩展—助力穿戴设备成贴心秘书 icon

实时转写：速度快，准确率高，支持支持2~6个说话人分离语音速记：支持天津、山东、东北、湖北、福建、河北、贵州、陕西等地口音多语种：支持普通话、英语、中英混说、粤语、四川话和上海话翻译：支持中英、英中等主流语钟文本翻译极速出稿：支持录音文件转写，录音1小时、5分钟出稿同声传译：普通话语音输入、翻译文本输出。