icon通话场景痛点icon
噪声环境复杂
多噪声源、干扰人声、本机播放噪声 婴儿啼哭、电视声、狗叫、键盘鼠标敲击声、电 风扇、空调声等点击鼠标声等。
交互体验差
市面主流方案更多是对上行进行降噪,远端噪声没有 解决 非稳态噪声,特别是干扰人声,消除难,业界难题 结合声纹、图像等方案前置条件/门槛高。
需兼容不同外设
外接有线耳机,需考虑对应信号的兼容性。
需兼容主流通讯平台
通过Teams、微信、钉钉、Zoom、WebEx、腾讯 会议等通讯平台进行通讯,需考虑对应信号的兼容性。
评价指标多种 难统一
业界标准不一,比较经典的是teams测试 主观体验 和 客观评测 难统一 结合声纹、图像等方案暂无标准评价指标。
icon思必驰AI背景降噪icon

核心算法基于传统信号处理+深度学习技术,结合麦克风阵列进行前端降噪,不受限于噪声类型,覆盖低信噪比全场景,大幅提升通话清晰度,改善噪声环境下的通话质量;双麦/四麦算法,分全向模式和定向模式,最远支持双麦3m/四麦5m拾音降噪。定向模式可以针对固定角度 进行音频增强。单麦算法,适合近场,可搭配耳机一起使用。

icon性能表现优秀icon
客观测试
Teams预测试关键指标,发送MOS:4.2,上行延时:算法60ms以内,回声抑制:60dB,双讲人声衰减<12dB Whisper测试关键指标,ns>20dB,speech loss<3dB
主观体验
噪声可以解决平稳噪声,可以部分解决非平稳噪声,可以解决回声,可以部分解决混响问题,支持远距离拾音人声,无延迟保真度高,清晰,双讲 ,人声连续,可懂度高
iconDmic降噪效果对比_手机铃声测试,距离mic最近距离 1cmicon
iconDmic降噪效果对比_定向干扰人声消除测试icon
iconDmic降噪效果对比_单点干扰源噪声测试icon
iconAmic(3.5mm)降噪效果对比_单点噪声测试icon
icon上行通话降噪plus,只保留主说话人声音——NFP方案icon

只保留扇形区域主说话人声音,去掉扇形区域外背景噪声和干扰人声,最左最右麦克风间距240mm,扇形区域半径50cm。

icon上行通话降噪plus,只保留主说话人声音——NFP方案音频效果icon
icon上行通话降噪plus,只保留主说话人声音——多模态交互方案icon
icon上行通话降噪plus,只保留主说话人声音——声纹voice filter方案icon
远端降噪——下行通话降噪

目前业界语音降噪方案更多是对近端进行降噪,远端降噪/下行通话降噪 可以消除对方传过来的背景噪声,即使对方所在背景环境噪音嘈杂,仍然可以听到对方清晰的通话内容;

支持喇叭播放/3.5mm耳机输出;

噪声模型能识别并消除多种噪声类型,并持续迭代升级;

噪声抑制深度30dB+。

icon带来的客户价值icon
极致通话体验
不仅对方听得清,自己也听得更清
场景丰富,支持扩展
不受限于噪声类型
支持远场拾音
支持细分领域的定制
接入灵活,快速可用
APO形式接入,也支持更低功耗GNA版本接入 支持Windows、Andorid、Linux等操作系统
icon对接流程清晰,周期短icon
icon全链路语音服务icon
实时语音识别
反馈速度快
延时率低:<0.2秒
垂直领域定制识别
企业尊享服务
定制服务好
领域定制VIP服务
企业尊享私有云部署
录音文件识别
准确率高
通用识别
一句话识别
又准又快
通用识别:>95%
响应时间:<6秒
iconASR主要产品类型icon
实时语音识别
对连续的音频流做实时识别,配有内置的智能断句,达到“边说边可见”的效果。可用于大会演讲投屏、 实时直播字幕、实时法庭庭审记录等场景
录音文件识别
对用户上传的录音文件或文件链接中的音频进行识别。可用于采访录音转写、庭审数据录入、会议记录总结等场景。
一句话识别
对时长较短(一分钟以内)的语音进行整句识别,通常适用于音频长度较短且能接受有延迟的获得识别 结果的场景,语音识别准确率通常会高于流式方式。应用场景包括:即时通讯语音转写等,可集成在各类App、即时通讯软件中
icon产品优势icon
速度快、准确率高
字级深度序列网络CTC建模,识别更快速、更精准
支持说话人聚类
智能区分不同说话人识别结果, 文本展示一目了然
完善的自训练功能
支持自训练语言模型、自定义热词、敏 感词,显著提升自定义场景识别体验
口语顺滑
自动过滤语气词,重复词,转写结果更流畅
安全可靠
99%服务可用性,加密数据协议,数据切片处理,纯机器计 算。
配置灵活
弹性扩容,支持高级客户专属转写队列。
icon声纹注册、验证过程icon
icon声纹确认示例icon
icon训练平台能力蓝图icon
icon定制专属模型,优化识别效果icon
专业术语、地名、人名等特殊指代用词往往影响着对话效果,同样,环境噪音、方言口音、中英混杂、语速等因素都会对对话效果产生不良影响。通过专属模型定制,相对提升识别性能,满足业务多样化需求。
icon缩短交付生产链路,提高规模化定制能力icon

已有的研发交付链路长,沟通成本高,用户在开发过程中过度依赖语音厂商,自主权不够。 思必驰DUI标注训练一体化平台,将数据标注和模型定制能力赋能用户,大大优化了生产链路。用户可独立完 成所有流程,语音厂商不参与其中,满足规模化生产需求。

icon训练标注一体化平台优势icon
识别率提升
从不可用到可用,解决两大核心问题:重口音、方言识别不准;领域专业词汇、术语的精准识别
私有化部署
私有化部署,更安全、更好用:基于客户自身的服务器部署,私密数据 的安全性更有保障;数据均在本地,更方便基于数据的管理和二次开发
行内首家
业内首家标准训练一体化解决方案:基础训练见效快,产品功能丰富,稳定的产品迭代
两大产品形态
灵活便捷一体机+高算力服务器两类产品:一体机「软件 + 硬件」结合,笔记本大小,轻松携带,方便调度,开箱即用,服务器版本适用大数据量情况
icon标杆案例icon
icon主动降噪(ANC)icon
icon思必驰PC ANC_自适应控制方案icon

疫情下,用户通常通过PC居家办公或打游戏,当CPU负载较高或者用户在玩高负载的游戏应用时, 风扇噪声会逐渐增大,会干扰到用户的使用体验。 通过探索一种区域性降噪的技术,让处于该区域的人员人耳接收到的风扇声音明显降低, 从而提高用户的使用体验

产品推荐 查看更多>>
    思必驰胸牌质检软硬件解决方案

    思必驰胸牌质检软硬件解决方案70*25mm标准胸牌外观,洛可可ID设计, 高端商务质感,彰显职业形象; 服务过程自然拾音,避免对录音笔排斥心理; 相比普通录音笔薄50%,厚度仅7mm,重量小于20g,支持激光镭雕、打印背胶粘贴、镂空镍标等多种加工工艺制作铭牌,满足企业客户的品牌视觉识别体系要求。

    音频传输-HUB

    可穿戴录音笔

    四麦阵列拾音

    支持APP扩展

    思必驰M4降噪会议麦克风音箱

    思必驰M4降噪会议麦克风音箱实时通话降噪,3 米拾音距离会议记录更省时。培训讲师声音更清晰,培训录音文稿整理更便捷。随声录音、语音实时转文字,出稿更便捷。

    语音转文字记录

    体积小巧

    超长续航

    智能降噪

    出门问问TTS解决方案

    出门问问TTS解决方案是从TTS端到端语音合成引擎,合成效果媲美真人,合成语音准确、流畅、自然,领先的韵律准确率,多音字准确率业界Top 1,覆盖喜/怒/哀/乐四个维度的情绪表达,情感强度控制,让合成语音更有温度感。优化端到端歌唱合成系统,输入乐谱(musicxml/midinode),输出歌曲音频。

    韵律流畅

    情感合成

    歌唱合成

    实时声音转换