魔音工坊AI配音平台_tts语音引擎_声音克隆软件

立即咨询

立即试用

商务合作

魔音工坊AI配音平台

魔音工坊AI配音平台拥有全能创新的音频合成编辑功能，成熟的应用商店能够南腔北调，语种多样以及情感合成，情绪多变。同时网页、小程序和APP，一个账户，多端通用，是短视频AI配音行业第一品牌。

立即咨询

出门问问TTS承接平台-魔音工坊 | 产品介绍视频 icon

出门问问TTS承接平台-魔音工坊 | 专业的AI配音软件 icon

• 全能创新的音频合成编辑功能：停顿调节、重音、声音转换等；

• 丰富的声音IP：央广满超、知名配音员杨婧、知名主播采采等；

• 成熟的应用商店：1000+发音人，1200+声音风格；

• 南腔北调，语种多样；

• 情感合成，情绪多变网页、小程序和APP，一个账户，多端通用；

• 100万+用户使用验证；

• 短视频AI配音行业第一品牌。

强大的音频合成编辑功能 icon

首创声音编辑器，可实现多音字、重度、停顿调节、连续等功能，支持局部变速、变音、多人配音，自带版权BGM、音效等。

1000+发音人满足用户多样性需求 icon

100+方言配音、外语配音，支持老人、小孩等不同年龄、不同音色的声音。

覆盖喜怒哀乐四大维度情绪，让声音更有温度 icon

同一发音人可支持二十多种情绪表达。

众多大咖入驻魔音

多元化的解决方案

• 魔音工坊会员授权；

• API调用；

•成熟的声音克隆技术；

• 私有化部署；

•SDK离在线混合方案，离线效果接近在线；

•离线SDK低资源消耗: CPU低，内存少；

• 完整的声音商店整体方案（支付、浏览、下载等）。

全新的后付费合作模式 icon

领先的声音定制服务

声音专属
供应商提供声音，可选择有限VS自己的声音打造专属的品牌

短周期
传统录音需3-6个月录音周期VS魔音工坊仅需1周即可输出声音模型

低成本
传统定制方案代价高昂：50万VS魔音工坊方案成本大幅度降低

魔音工坊声音克隆八大优势 icon

高品质配音
量身定制声音模型、高度还原音色、企业级TTS定制服务

情绪饱满、真实自然
音质清晰、声音流畅、多种情绪合成能力

声音转化
支持声音转换功能强化情绪表现

录制门槛低
20句、100句、500句三种模式可选小时级别，快速取得数据

服务专业
一站式专业团全程跟进、提供7*24小时服务

交付快速
从需求确认到上线、最快3天可交付

使用方便
适配魔音全套配音工具、云端服务，随时随地，即用即享

安全可靠
定制声音部署到魔音工坊、根据客户需求，授权使用方独家使用

魔音工坊声音克隆八大应用场景 icon

语音助手
搭载手机、车载语音服务、帮助企业客户为其用户定制声音

宣传片配音
声音作为品牌资产可以被长期持有，让宣传物料配音更规划化、统一化

自媒体配音
短视频、公众号配音不仅可以更高效配音，还可以拥有独一无二的声音

IP/数字人配音
每个IP都可以有专属声音，IP价值不会因配音人员流失而受损

有声读物
有声书、有声电台、儿童书籍等有声读物配音，更省时、省力

声音分身
作为企业意见领袖、明星的声音分身帮其承担企业文化宣传、祝福ID等录制

声音陪伴
亲子故事、父母聊天、恋人陪伴让声音替代真人，增强亲人之间的互动

声音永存
逝去的人，声音可以得到永存

声音转换，音色转化成其他发音人 icon

说话人转换：保留「原说话人」的声调、韵律、停顿等特色，音色转换成「目标人」音色。

实时变声功能&声纹识别-听音识人 icon

Dupdub（魔音海外版）：助力短视频出海 icon

Overview of DupDub icon

品牌合作案例

品牌合作案例-微信读书 icon

微信读书、微信听书均已使用出门问问TTS技术服务。

通过TTS合成技术和魔音工坊发音人在平台生产有声书作品。

点击收听实际案例《墨桑》，此案例在微信听书已经上线。

出门问问TTS技术优势

端到端语音合成引擎

自主研发端到端语音合成引擎MeetHiFiVoice 合成语音准确、流畅、自然 MOS值接近4.5

韵律流畅、发音准确

领先的韵律准确率，多音字准确率业界Top 1 语气/语调合成和重读/拖音功能拟人化TTS

情感合成&跨语种声音合成

覆盖喜/怒/哀/乐四个维度的情绪表达，情感强度控制，让合成语音更有温度感跨语种合成能力

歌唱合成

优化端到端歌唱合成系统，输入乐谱(musicxml/ midinode)，输出歌曲音频

实时声音转换&角色迁移

实时声音转换能力角色迁移，发音人可以模仿不同的年龄和性别，同时保留原本音色特点

声音克隆

20句声音克隆，100句声音克隆，500句声音克隆

高品质声音输出

48K超高清音质

1-TTS端到端语音合成引擎，合成效果媲美真人 icon

业界领先的完全端到端模型，合成效果高度接近真人（MOS：4.488）端到端语音合成方案MeetHiFiVoice (Mobvoi End-to-End TTS HiFiVoice)MOS是通信术语，值常以衡量通信系统语音质量的重要指标， MOS值在4.0-5.0区间,音频级别为优,表示听的清楚,延迟小,交流顺畅。

领先的韵律准确率，多音字准确率业界Top 1 icon

• 领先的韵律准确率：

可根据控制曲线控制生产音频的音高可控制每一个字的合成时长独创的停顿调节功能，快捷修复韵律问题。

• 多音字准确率业界Top 1（99.56%）：

独创的多音字纠错，已积累百万条多音字标注数据。

• 领先的韵律准确率：

可根据控制曲线控制生产音频的音高可控制每一个字的合成时长独创的停顿调节功能，快捷修复韵律问题

• 多音字准确率业界Top 1（99.56%）：

独创的多音字纠错，已积累百万条多音字标注数据

丰富的语气/语调合成和重读/拖音功能，增强声音的表现力 icon

语气合成技术
结合NLP及多模态识别，实现不同语气合成，丰富的语气更能够增加音频的表现力

Demo演示
陈述/疑问/感叹效果，他们的上司老黑，同意了这次行动。他们的上司老黑，同意了这次行动！他们的上司老黑，同意了这次行动？

重读/拖音功能
用重音去强调部分、传递新信息、对比信息，或者是澄清信息重读：音调加重拖音：音长拉伸重读 + 拖音：音调加重 + 音长拉伸

Demo演示
这样漂亮的姑娘，难怪我家孙儿日夜思念，魂不守舍

拟人化TTS，让声音更自然 icon

• 拟人化TTS：

结合文案，生成更自然、轻松的语音，拟人化因素包含延音、插入停顿、插入语气词、重读、快语速、情感等。

应用场景：适合车载助手、语音聊天助手、闲聊机器人。

• Demo演示：

哎太强了,诶,你在哪儿了? 嗯,对,嘶,诶,所以你觉得,就是young老师他上课的有趣的点在哪儿呢?

情感语音合成

覆盖喜/怒/哀/乐四个维度的十几种情绪表达，让合成语音更有温度感

情感迁移语音合成

跨说话人情感迁移语音合成：在发音人无情感数据的情况下，使该发音人的模型能够合成情感音频，降低情感模型成本，无需录制情感数据可以扩充线上发音人风格多样性，可扩展至离线，单个模型可合成多情感音色。

情感强度控制

情感强度可控

发音人在无情感数据的情况下，除了能够合成发音人的情感声音，还能做到情感强度的可控。

跨语种语音合成

• 跨语种语音合成

在发音人无其他语种（英文、日文等）数据的情况下，使该发音人的模型能够合成该语种音频降低发音人成本，不需要寻找会多种语言的发音人也能合成多种语言，并增加录制成本可以扩充线上发音人语言多样性

• Demo演示

中文，英文，日文

歌唱合成&歌唱合成迁移 icon

歌唱合成

优化端到端歌唱合成系统，输入乐谱(musicxml/midinode)，输出歌曲音频。

Demo演示

匆匆那年-干音青春修炼手册-干音阴天-干音匆匆那年-BGM版。

歌唱合成迁移

TTS音色迁移到歌唱，使用TTS的训练数据训练歌唱模型发音人-魔佐伊发音人-魔欣怡发音人-魔玲珑。

实时声音转换

实时声音转换

声音转换使用Encoder-Decoder模型，并结合vocoder生成对应音频，获得更好的解析力与表达能力，并更加适配实时语音转换多种声音可选，无延迟实时转化

角色迁移

发音人可以模仿不同的年龄和性别，同时保留原本的音色特点。例如，青年男性发音人的声音可以通过降低音调和语速来模拟老年发音人的语音，但发音人的身份不变。降低发音人录制成本，提高线上发音人多样性（扩充年龄段和性别）。

Demo演示

初始声音为青少年女，角色迁移模型可以得到该发音人另外9个角色。

声音克隆

声音克隆

最短只需录制20句话，在小时级别内即可获得声音模型同时可以在不额外录制数据的情况下，让声音拥有丰富的情感以及多语言能力 3种声音克隆服务：20句试用版，100句个人定制版，500句企业定制版

高品质声音输出

48K尊享音质：

8 kHz：电话的采样率

16 kHz：大部分语音助手都使用这个采样率

22.05 kHz：无线电广播的采样率

44.1 kHz：CD 的采样率

48 kHz：专业音频的采样率

48K尊享音质

8 kHz：电话的采样率

16 kHz：大部分语音助手都使用这个采样率

22.05 kHz：无线电广播的采样率

44.1 kHz：CD 的采样率

48 kHz：专业音频的采样率

愿景：定义下一代人机交互，让人和机器的交互更自然 icon

2012
公司成立

2013-2014
专注语音AI算法积累

2015-2018
软硬结合智能可穿戴、智能车载、智能家居

2019
前装车载语音助手落地大众汽车

2021+
元宇宙的基础建设 AI Voice + Digital Avatar

浓厚的技术基因

一流团队
创始人李志飞博士毕业于美国约翰霍普金斯大学、曾任Google美国总部研究科学家现有员工约400人，60%为研发人员，其中50%拥有研究生或以上学历。

核心AI专利数百项
申请900余件专利，其中发明超过680件，海外专利100余件，PCT国际申请20余件，获得各类授权专利430余件。

前瞻性AI基础研究
构建通用语言智能算法平台（UCLAI）开源端到端语音识别训练系统Wenet 近几年在国际顶级会议发表20+篇学术论文（如ACL，EMNLP，ICASSP等）。

行业资质与奖项
“国家高新技术企业”资质 “中国独角兽企业”（2017年起连续五年） “吴文俊人工智能科技奖”（中国智能科学领域最高奖）多项软硬件产品获得国家权威检测机构优秀等级。

商业逻辑架构：以AI算法为切入点，赋能各行各业 icon

技术
全栈式AI语音核心算法软硬结合

产品实现
智能可穿戴设备智能车载元创岛魔音工坊

商业化
全球化多模态 AIOT + AI SaaS

创新与未来
Digital Avatar Sounds like you Looks like you Acts like you 元宇宙基础建设

AI算法：基于神经网络的自主全栈式AI算法 icon

信号处理

声源定位、波束形成、回声消除混响抑制、噪音抑制、盲源分离。

语音唤醒

支持多语种热词。

语音识别

普通话及带口语的普通话、粤语、英文 8K信道可达85%, 16K信道可达96% 。

语义理解

基于知识图谱 13个维度、 130多个垂直领域。

对话管理

支持单轮、多轮对话。

语言生成

集成情感模型。

语音合成

支持男声、女声、台湾女声、女童声 MOS值 4.5。

核心技术能力：语音交互 icon

商业落地：全球领先的AI可穿戴设备 icon

AI可穿戴：一流的国际产业合作伙伴 icon

出门问问 x 谷歌

2015年10月获得谷歌C轮融资；

成为谷歌在中国的官方合作伙伴；

为Wear OS阵营合作品牌提供中文语音核心系统。

出门问问 x 高通

高通全球战略合作伙伴；

可穿戴芯片4100的全球首发。

商业落地：智能车载（德国车规级前装语音助手） icon

出门问问车载前装“离线在线融合语音助手”落地多款大众主力车型

商业落地：AI算法license落地 icon

智能手表和真无线蓝牙耳机是高增长、高天花板的市场，将持续成为ToC增长引擎。

产品推荐

美洽智能语音机器人

美洽智能语音机器人专注解决呼叫难题，全面触达目标客户，助力全域提效。无需购买额外设备，功能丰富，简单易学，支持自定义拖拽配置，操作自由流畅，更可以一键启动，快速投入使用。基于实时语音识别(ASR)、自然语言处理(NLP)、语音合成(TTS)等技术，实现智能外呼与应答，媲美真人的语音及对话，助力企业与客户高效沟通，让数智化客户服务为企业带来更高转化。

免费试用

查看详情

合合信息企业数字化转型解决方案

合合信息的企业数字化转型解决方案以智能文字识别和商业大数据技术为核心，为30多个行业提供全面的数字化服务。该方案通过多样化的高性能产品体系，帮助企业实现智能决策，涵盖智慧银行、保险、证券、供应链、地产、政务和医药等多个领域。服务优势包括17年的技术积累、灵活接入方式、稳定的服务、过硬的技术支持和无忧的售后服务。此外，合合信息与腾讯云等合作伙伴共同推动企业加速数字化转型，构建数字转型共同体的强大生态力量。在数据资产管理方面，合合信息分享了从数据到智能的数据资产管理经验，通过创新数据资产管理方法，解决数据资产管理难点，释放数据要素价值，发展新质生产力。合合信息的“数字政务大脑”作为其数字政府智能解决方案，依托智能OCR识别技术和企业全景实时数据，为政府提供精细化的数据采集、分析、治理、应用的解决方案，推动城市产业数字化和数字产业化的转型升级。

免费试用

查看详情

Talend大数据集成

Talend大数据集成在云，本地或混合基础架构中的任何地方大规模摄取和处理大数据。

免费试用

查看详情

腾讯云微瓴智慧建筑系统案例

腾讯云微瓴是一个腾讯自主设计研发的，适合各行业的、安全、灵活且可以高效触达用户的物联网操作系统，在智慧建筑和智慧城市场景中担当物、信息与人协作的枢纽。微瓴智能建造平台是基于微瓴数字开放平台，通过对工程建造领域IOT数据、业务数据、空间数据的融合，为工程建造提供数据共建共用、模型共建共享、应用共建共生的一站式建筑产业互联网平台。

免费试用

查看详情