icon出门问问TTS承接平台-魔音工坊 | 产品介绍视频icon
icon出门问问TTS承接平台-魔音工坊 | 专业的AI配音软件 icon
 
• 全能创新的音频合成编辑功能:停顿调节、重音、声音转换等;
• 丰富的声音IP:央广满超、知名配音员杨婧、知名主播采采等;
• 成熟的应用商店:1000+发音人,1200+声音风格;
• 南腔北调,语种多样;
• 情感合成,情绪多变网页、小程序和APP,一个账户,多端通用;
• 100万+用户使用验证;
• 短视频AI配音行业第一品牌。
icon强大的音频合成编辑功能 icon

首创声音编辑器,可实现多音字、重度、停顿调节、连续等功能,支持局部变速、变音、多人配音,自带版权BGM、音效等。

icon1000+发音人满足用户多样性需求 icon

100+方言配音、外语配音,支持老人、小孩等不同年龄、不同音色的声音。

icon覆盖喜怒哀乐四大维度情绪,让声音更有温度 icon

同一发音人可支持二十多种情绪表达。

icon众多大咖入驻魔音 icon
icon多元化的解决方案 icon
 
• 魔音工坊会员授权;
• API调用;
•成熟的声音克隆技术;
• 私有化部署;
•SDK离在线混合方案,离线效果接近在线;
•离线SDK低资源消耗: CPU低,内存少;
• 完整的声音商店整体方案(支付、浏览、下载等)。
icon全新的后付费合作模式 icon
icon领先的声音定制服务icon
声音专属
供应商提供声音,可选择有限VS自己的声音打造专属的品牌
短周期
传统录音需3-6个月录音周期VS魔音工坊仅需1周即可输出声音模型
低成本
传统定制方案代价高昂:50万VS魔音工坊方案成本大幅度降低
icon魔音工坊声音克隆八大优势 icon
高品质配音
量身定制声音模型、高度还原音色、企业级TTS定制服务
情绪饱满、真实自然
音质清晰、声音流畅、多种情绪合成能力
声音转化
支持声音转换功能 强化情绪表现
录制门槛低
20句、100句、500句 三种模式可选 小时级别,快速取得数据
服务专业
一站式专业团全程跟进、提供7*24小时服务
交付快速
从需求确认到上线、最快3天可交付
使用方便
适配魔音全套配音工具、云端服务,随时随地,即用即享
安全可靠
定制声音部署到魔音工坊、根据客户需求,授权使用方独家使用
icon魔音工坊声音克隆八大应用场景 icon
语音助手
搭载手机、车载语音服务、帮助企业客户为其用户定制声音
宣传片配音
声音作为品牌资产可以被长期持有,让宣传物料配音更规划化、统一化
自媒体配音
短视频、公众号配音不仅可以更高效配音,还可以拥有独一无二的声音
IP/数字人配音
每个IP都可以有专属声音,IP价值不会因配音人员流失而受损
有声读物
有声书、有声电台、儿童书籍等有声读物配音,更省时、省力
声音分身
作为企业意见领袖、明星的声音分身 帮其承担企业文化宣传、祝福ID等录制
声音陪伴
亲子故事、父母聊天、恋人陪伴让声音替代真人,增强亲人之间的互动
声音永存
逝去的人,声音可以得到永存
icon声音转换,音色转化成其他发音人 icon

说话人转换:保留「原说话人」的声调、韵律、停顿等特色,音色转换成「目标人」音色。

icon实时变声功能&声纹识别-听音识人icon
iconDupdub(魔音海外版):助力短视频出海 icon
iconOverview of DupDub icon
icon品牌合作案例 icon
icon品牌合作案例-微信读书 icon
 
微信读书、微信听书均已使用出门问问TTS技术服务。
通过TTS合成技术和魔音工坊发音人在平台生产有声书作品。
点击收听实际案例《墨桑》,此案例在微信听书已经上线。
出门问问TTS技术优势
01
端到端语音合成引擎

自主研发端到端语音合成引擎MeetHiFiVoice 合成语音准确、流畅、自然 MOS值接近4.5

02
韵律流畅、发音准确

领先的韵律准确率,多音字准确率业界Top 1 语气/语调合成和重读/拖音功能 拟人化TTS

03
情感合成&跨语种声音合成

覆盖喜/怒/哀/乐四个维度的情绪表达,情感强度控制,让合成语音更有温度感 跨语种合成能力

04
歌唱合成

优化端到端歌唱合成系统, 输入乐谱(musicxml/ midinode),输出歌曲音频

05
实时声音转换&角色迁移

实时声音转换能力 角色迁移,发音人可以模仿不同的年龄和性别,同时保留原本音色特点

06
声音克隆

20句声音克隆,100句声音克隆,500句声音克隆

07
高品质声音输出

48K超高清音质

 
icon1-TTS端到端语音合成引擎,合成效果媲美真人 icon

业界领先的完全端到端模型,合成效果高度接近真人(MOS:4.488) 端到端语音合成方案MeetHiFiVoice (Mobvoi End-to-End TTS HiFiVoice)MOS是通信术语,值常以衡量通信系统语音质量的重要指标, MOS值在4.0-5.0区间,音频级别为优,表示听的清楚,延迟小,交流顺畅。

icon领先的韵律准确率,多音字准确率业界Top 1icon
• 领先的韵律准确率:
可根据控制曲线控制生产音频的音高 可控制每一个字的合成时长 独创的停顿调节功能,快捷修复韵律问题。
• 多音字准确率业界Top 1(99.56%):
独创的多音字纠错,已积累百万条多音字标注数据。
 
• 领先的韵律准确率:
可根据控制曲线控制生产音频的音高 可控制每一个字的合成时长 独创的停顿调节功能,快捷修复韵律问题
• 多音字准确率业界Top 1(99.56%):
独创的多音字纠错,已积累百万条多音字标注数据
icon丰富的语气/语调合成和重读/拖音功能,增强声音的表现力icon
语气合成技术
结合NLP及多模态识别,实现不同语气合成,丰富的语气更能够增加音频的表现力
Demo演示
陈述/疑问/感叹效果,他们的上司老黑,同意了这次行动。他们的上司老黑,同意了这次行动!他们的上司老黑,同意了这次行动?
重读/拖音功能
用重音去强调部分、传递新信息、对比信息,或者是澄清信息重读:音调加重 拖音:音长拉伸 重读 + 拖音:音调加重 + 音长拉伸
Demo演示
这样漂亮的姑娘,难怪我家孙儿日夜思念,魂不守舍
icon拟人化TTS,让声音更自然icon
• 拟人化TTS:
结合文案,生成更自然、轻松的语音,拟人化因素包含延音、 插入停顿、插入语气词、重读、快语速、情感等。
应用场景:适合车载助手、语音聊天助手、闲聊机器人。
• Demo演示:
哎太强了,诶,你在哪儿了? 嗯,对,嘶,诶,所以你觉得,就是young老师他上课的有趣的点在哪儿呢?
icon情感语音合成 icon
 
情感语音合成
覆盖喜/怒/哀/乐四个维度的十几种情绪表达,让合成语音更有温度感
 
情感迁移语音合成
跨说话人情感迁移语音合成:在发音人无情感数据的情况下,使该发音人的模型能够合成情感音频,降低情感模型成本,无需录制情感数据 可以扩充线上发音人风格多样性,可扩展至离线,单个模型可合成多情感音色。
icon情感强度控制 icon
 
情感强度可控
发音人在无情感数据的情况下,除了能够合成发音人的情感声音,还能做到情感强度的可控。
icon跨语种语音合成 icon
• 跨语种语音合成
在发音人无其他语种(英文、日文等)数据的情况下,使该发 音人的模型能够合成该语种音频 降低发音人成本,不需要寻找会多种语言的发音人也能合成多 种语言,并增加录制成本 可以扩充线上发音人语言多样性
 • Demo演示
中文,英文,日文
icon歌唱合成&歌唱合成迁移 icon
 
歌唱合成
优化端到端歌唱合成系统,输入乐谱(musicxml/midinode),输出歌曲音频。
Demo演示
匆匆那年-干音 青春修炼手册-干音阴天-干音匆匆那年-BGM版。
歌唱合成迁移
TTS音色迁移到歌唱,使用TTS的训练数据训练歌唱模型 发音人-魔佐伊发音人-魔欣怡 发音人-魔玲珑。
icon实时声音转换 icon
 
实时声音转换
声音转换使用Encoder-Decoder模型,并结合vocoder生成 对应音频,获得更好的解析力与表达能力,并更加适配实时语音转换多种声音可选,无延迟实时转化
icon角色迁移 icon
 
角色迁移
发音人可以模仿不同的年龄和性别,同时保留原本的音色特点。 例如,青年男性发音人的声音可以通过降低音调和语速来模拟 老年发音人的语音,但发音人的身份不变。 降低发音人录制成本,提高线上发音人多样性(扩充年龄段和性别)。
Demo演示
初始声音为青少年女,角色迁移模型可以得到该发音人另外9个角色。
icon声音克隆 icon
声音克隆
最短只需录制20句话,在小时级别内即可获得声音模型 同时可以在不额外录制数据的情况下,让声音拥有丰富的情感 以及多语言能力 3种声音克隆服务:20句试用版,100句个人定制版,500句企 业定制版
icon高品质声音输出icon
 
48K尊享音质:
8 kHz: 电话的采样率
16 kHz: 大部分语音助手都使用这个采样率
22.05 kHz: 无线电广播的采样率
44.1 kHz:CD 的采样率
48 kHz: 专业音频的采样率
48K尊享音质
8 kHz: 电话的采样率
16 kHz: 大部分语音助手都使用这个采样率
22.05 kHz: 无线电广播的采样率
44.1 kHz:CD 的采样率
48 kHz: 专业音频的采样率
icon愿景:定义下一代人机交互,让人和机器的交互更自然 icon
2012
公司成立
2013-2014
专注语音AI算法积累
2015-2018
软硬结合 智能可穿戴、智能车载、智能家居
2019
前装车载语音助手 落地大众汽车
2021+
元宇宙的基础建设 AI Voice + Digital Avatar
icon浓厚的技术基因 icon
一流团队
创始人李志飞博士毕业于美国约翰霍普金斯大学、曾任Google美国总部研究科学家 现有员工约400人,60%为研发人员, 其中50%拥有研究生或以上学历。
核心AI专利数百项
申请900余件专利,其中发明超过680件,海外专利100余件,PCT国际申请20余件,获得各类授权专利430余件。
前瞻性AI基础研究
构建通用语言智能算法平台(UCLAI) 开源端到端语音识别训练系统Wenet 近几年在国际顶级会议发表20+篇学术论文(如ACL,EMNLP,ICASSP等)。
行业资质与奖项
“国家高新技术企业”资质 “中国独角兽企业”(2017年起连续五年) “吴文俊人工智能科技奖”(中国智能科学领域最高奖) 多项软硬件产品获得国家权威检测机构优秀等级。
icon商业逻辑架构:以AI算法为切入点,赋能各行各业 icon
技术
全栈式AI语音 核心算法 软硬结合
产品实现
智能可穿戴设备 智能车载 元创岛 魔音工坊
商业化
全球化 多模态 AIOT + AI SaaS
创新与未来
Digital Avatar Sounds like you Looks like you Acts like you 元宇宙基础建设
iconAI算法:基于神经网络的自主全栈式AI算法icon
 
信号处理
声源定位、波束形成、回声消除 混响抑制、噪音抑制、盲源分离。
语音唤醒
支持多语种热词。
语音识别
普通话及带口语的普通话、粤语、英文 8K信道可达85%, 16K信道可达96% 。
语义理解
基于知识图谱 13个维度、 130多个垂直领域。
 
对话管理
支持单轮、多轮对话。
语言生成
集成情感模型。
语音合成
支持男声、女声、台湾女声、女童声 MOS值 4.5。
icon核心技术能力:语音交互icon
icon商业落地:全球领先的AI可穿戴设备 icon
iconAI可穿戴:一流的国际产业合作伙伴 icon
 
出门问问 x 谷歌
2015年10月获得谷歌C轮融资;
成为谷歌在中国的官方合作伙伴;
为Wear OS阵营合作品牌提供中文语音核心系统。
出门问问 x 高通
高通全球战略合作伙伴;
可穿戴芯片4100的全球首发。
icon商业落地:智能车载(德国车规级前装语音助手) icon

出门问问车载前装“离线在线融合语音助手”落地多款大众主力车型

icon商业落地:AI算法license落地 icon

智能手表和真无线蓝牙耳机是高增长、高天花板的市场,将持续成为ToC增长引擎。

产品推荐 查看更多>>
    思必驰智慧物联解决方案

    思必驰智慧物联解决方案基于海量声学和文本数据,提供以任务型对话为主,兼具闲聊和问答的综合性对话服务。提供通用的内置技能;支持自定义对话逻辑和内容;细致到每一轮交互的超高度定制。

    全链路对话

    超高度定制

    语音输入板

    声纹识别

    思必驰耳机/眼镜/手表语音解决方案

    思必驰耳机/眼镜/手表语音解决方案的智能降噪技术采用的是“两者兼融”的方式——传统分离结合深度学习方案,兼顾传统信号处理的保真性和深度学习的非稳态噪声抑制能力,即在很好的去除非稳态噪声的同时保证语音的较小失真,听感更自然。

    低功耗高性能

    全场景降噪

    差异化方案

    一站式服务

    科大讯飞语音调度系统

    通过讯飞语音识别技术,精准命中调度指令,结合NLP语义理解,将文本信息转换成机器指令传入系统,进行具体事项操作,同时还可以加入TTS语音合成技术,在执行指令时,进行状态播报,以达到人机交互,准确把控指令操作。

    方言识别

    多语种识别

    机器翻译

    命令词控制