讯云语音合成产品满足将文本转化成拟人化语音的需求,打通人机交互闭环。通过提供多场景、多情感、多语言、多音色的选择,对合成业务实现更全面的支撑能力。同时,腾讯云语音合成支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。
腾讯云语音合成支持70余个音色,其中包含精品音色40余个,支持包括中文普通话、粤语、英文在内的多个中文方言与语种,对主流的语音合成业务场景有很好的适配性。此外,产品也支持SSML标记语言,客户可根据需要进行参数配置,实现更自然的TTS音色。腾讯云语音合成(TTS)目前有四个产品类型:基础语音合成、实时语音合成、长文本语音合成、离线语音合成。基础语音合成适用于较短文本(150字以内),且无实时性要求的场景;实时语音合成支持中长文本(600字以内),且对实时性要求高的场景;长文本语音合成适合较长文本(10万字以内),适用于有声阅读、新闻媒体等场景;离线语音合成支持在无网络的情况下进行语音合成。
腾讯云语音合成(TTS)在线版目前有三个产品类型:标准语音合成、实时语音合成、长文本语音合成。标准语音合成适用于较短文本(150字以内),且无实时性要求的场景;实时语音合成支持中长文本(600字以内),且对实时性要求高的场景;长文本语音合成适合较长文本(10万字以内),适用于有声阅读、新闻媒体等场景。
腾讯云语音合成(TTS)在线版目前有三个产品类型:标准语音合成、实时语音合成、长文本语音合成。标准语音合成适用于较短文本(150字以内),且无实时性要求的场景;实时语音合成支持中长文本(600字以内),且对实时性要求高的场景;长文本语音合成适合较长文本(10万字左右),适用于有声阅读、新闻媒体等场景。
腾讯云语音合成(TTS)支持不同场景下的多种音色,对主流的方言和语种也有所覆盖(蓝色代表特色音色)。
腾讯云语音合成(TTS)离线版目前有一个产品类型:离线语音合成,主要的接入方式为客户端(Android、iOS)SDK。离线语音合成适用于无网络、弱网情况下的语音合成场景,与在线版相同,离线语音合成也支持基础音色、精品音色两种音色品质(但不支持长文本合成),建议客户根据使用场景及设备性能状况选择合适的音色进行使用。精品音色合成效果好,但资源消耗较大,如果设备性能比较差的情况下,建议只使用基础音色。
腾讯云语音合成(TTS)支持SSML标记语言,SSML是基于 XML 的语音合成标记语言;可以更加准确、具体的定义合成音频的效果。腾讯云语音合成服务的 SSML 实现,基于 W3C 的语音合成标记语言版本1.1。目前只有中文合成支持 SSML 功能。
腾讯云语音合成(TTS)支持SSML标记语言,SSML是基于 XML 的语音合成标记语言;可以更加准确、具体的定义合成音频的效果。腾讯云语音合成服务的 SSML 实现,基于 W3C 的语音合成标记语言版本1.1。目前只有中文合成支持 SSML 功能。
腾讯云语音合成(TTS)支持SSML标记语言,SSML是基于 XML 的语音合成标记语言;可以更加准确、具体的定义合成音频的效果。腾讯云语音合成服务的 SSML 实现,基于 W3C 的语音合成标记语言版本1.1。目前只有中文合成支持 SSML 功能。
腾讯云语音合成(TTS)在合成技术、适用场景、音色自然度和个性化音色上都有明显优势,可为不同行业、不同需求的客户提供高质量的服务。同时,腾讯云还能支持客户的商用级音色定制需求(详情请参照产品-声音工坊)。TTS是AI最早的应用场景之一,距今已有数余年,目前语音产品已经形成几家巨头,如何突破巨头垄断、实现客户成功成为许多伙伴的售前难题。本章也会对行业趋势进行介绍。腾讯云语音合成(TTS)在技术、功能和听感体验上都有明显优势,在市场上处于业界领先地位。
语音合成业界整体的大趋势有以下几点:情感化趋势、定制化趋势、多语种+多方言趋势。
腾讯云语音合成(TTS)致力于在支持通用音色的基础上,为客户提供情感化、定制化、多方言语种的行业技术解决方案。
腾讯云语音合成(TTS)在智能客服、短视频配音、智能家居、有声阅读、银行、保险、证券、物流、运营商、法庭、房地产、教育等多个行业有落地经验,积累了丰富的行业词库和标杆案例。