DUIX(Dialog User Interface )基于用户对话的操作系统。 ASR/TTS/声音克隆等能力模块,是DUIX的核心构件。
快启的AI智能语音服务已经广泛应用于智慧金融、智慧保险、智慧教育、智慧政务等行业,在营销、 回访、催收、客户关怀、业务咨询等众多场景中积累了丰富的经验。
自动语音识别(Automatic Speech Recognize)技术,是让机器通过识别和理解过程使之听懂人类语言的技术。语音识别技术是信息 技术中人机交互的关键技术,目前已经在呼叫中心、银行办理业务、企业信息化系统中有了广泛的应用。随着语音识别在语音搜索、 语音控制等全新应用领域的深入应用,语音识别技术被业界权威人士誉为有可能引发人机界面领域革命的关键技术。
快启AI智能语音合成采用先进的端到端神经网络技术,脱离自回归网络结构,声学模型和声码器采用并行化合成技术,可以 将文本快速转换成流畅自然的语音。提供多种音色选择,支持音量、语速自定义调节及声音克隆,贴近应用场景,合成音色饱满音质拟人。
机器人提供录音服务,支持合成音、真人录音,为机器人话术增色。
行业领先的VAD算法,毫秒级智能检测声音边界准确判断有效打断和无效打断,如真人般交流。