icon小样本数智人产品简介icon

小样本数智人:即通过少量的小样本素材(3~5分钟),即可导入训练模型,生成与真人无异的数字人分身,五官、动作、表情完全模仿真人。使用方式:仅需通过输入文本或音频,即可快速生成数智人分身视频,大幅节省每次拍摄的时间、空间、用人成本。应用场景:适用于内容讲解、口播视频生产、直播带货等需要真人出镜的场景,节约成本,全年无休。

icon小样本数智人形象定制icon
icon小样本数智人成品视频示例icon
icon小样本和精品形象的差异icon
icon快速、低成本的声音定制icon

提供50~100句话的声音素材,就可以进行声音复刻

icon输入及交付物总结icon
  用户输入 交付物
形象定制 用户提供一段3~5分钟的视频素材 API / 视频文件 / 视频流 /  斯芬克斯播报平台
1. 通过输入任意文字,就可以生成一段数智人播报视频;
2. 不做声音定制时,会搭配一个默认的tts音色。
声音定制 用户提供一段20~100句话的录音音频 API / 斯芬克斯播报平台
需要搭配形象定制一起使用
icon拍摄物料icon

摄像机、提词设备、背景轴、单色背景布、灯光器械、收音耳麦、场景道具、单位机、返送屏、泡沫板、三脚架、监视器等

icon拍摄环境icon
环境
需要寻找一个安静尽量没有噪声和混响的录制环境
光线尽量充足,灯光均匀,脸部无阴影
根据景别调整相机和人之间位置
摄像机
摄像头要固定,无抖动
帧率:25帧率或50帧率
分辨率:1080P到4K,分辨率越高越好
压缩码率crf=6;参考ffmpeg里面的参数
icon拍摄景别icon

坐姿前面若有桌面、摆件,摆件要完整出现在画面中;道具的颜色不要和绿幕同色系。

icon录制过程【方式1:一镜到底】icon
拍摄要求
拍摄整体相关:整个过程一录到底,相机不中断;不能出现视频拼接的情况;拍摄后的视频不做额外的压缩转码;开始和结尾处人物进出摄像头的数据不要保留,需要裁剪掉。 模特发型和服装:发型尽量简单,不要太多毛边或缝隙不利于抠图;脸部要全部露出;服装颜色要和幕布颜色有差异和区分度;不建议佩戴长款耳坠。脖子不要有遮挡。模特动作相关:模特头要正对镜头,不要俯视或仰视;动作自然,可加上自然的点头、微笑,眨眼,动作尽量可复用;动作不要出框,不要挡住脸部;不要有大幅的转头动作。模特口型相关:朗读的文本可自行选择,可以朗读一段与实际业务场景相关的文本。如没有文本可参考《附录1》;说话吐字清晰,嘴巴张开,口型不宜过小;说话过程中不要吐舌头;语速适中,不要过快或过慢。
icon录制过程【方式2:分段拍摄】icon

每段视频时长:每段在1分钟以上,几段视频加起来要5分钟或以上即可;(单段视频不能出现剪辑拼接的情况)拍摄环境:每段视频的相机位置、曝光参数、背景、灯光、模特服饰、发型等要保持稳定;模特位置:每段视频模特头部位置相对固定(参考点:所有视频人脸鼻尖位置不能超出第一段视频首帧头部区域)拍摄结束:提交多段无压缩转码等处理的高清原视频;其他拍摄要求:其他拍摄要求与方式1一致。

icon附录1:形象定制文本icon
爱情,古老永恒又年轻常新的字眼。才子佳人、怨女痴男,多少的悲欢离合,多少的血泪辛酸。由此,无数的文人墨客,几多真挚的描写、热烈的咏叹。于是有了:关关雎鸠的吟唱,孔雀永远的飞翔,那哭倒的长城,哭不倒的爱情,沉没的百宝箱,沉没不了的爱的向往,还有罗密欧与朱丽叶,梁山伯与朱英台,千古绝唱,唱着:“愿普天下有情的都成了眷属”万般追问“问世间情是何物,只教人生死相许”。《西厢记》突破了杂剧一本四折的形式,是五本21折的连本戏。《长亭送别》,共十九支曲文,按时间的推移、情节的发展,可分为四个场面。艺术触角伸展到人物的心灵深处,集中刻画的是莺莺送别张生时细致复杂的心境、意绪。《西厢记》的曲词历来被人称道。朱权在《太和正音谱》中说“王实甫之词如花间美人,铺叙委婉,深得骚人之趣。极有佳句,若玉环之出浴华清,绿珠之采莲洛浦。”《长亭送别》这一折又尤其突出。身为名门闺秀的莺莺和琴剑飘零的书生相爱本身,在很大程度上就是对以门第、财产、权势为条件的传统择偶标准的违逆。
《长亭送别》一折表现的则是崔张爱情取得初步胜利后的又一次曲折——张生去赶考,莺莺来送别,两人被迫分离。整折戏虽没有曲折复杂的戏剧情节,却有撼人的艺术魅力。这魅力主要来自作者精心安排的19支曲词。这些曲词对处于长亭送别这一特定时空交叉点的莺莺的心灵作了细腻的刻画,多层次地展示了莺莺“此恨谁知”的复杂心理——既有对“前暮私情,昨夜成亲,今日别离”的张生的百般依恋,又有对即将来临的“南北东西万里程”的别离的万般痛苦;既有对“拆鸳鸯在两下里”的科举功名的深深怨恨,也有对当时司空见惯的身荣之后“停妻再娶妻”行为的不尽忧虑。这一复杂的心理内涵体现了莺莺纯净的灵魂美,也突出了她叛逆的性格。《长亭送别》给人以深沉的美感享受,它是一首真挚的抒情诗,是一幅淡雅的水墨画,是一支动人心弦的离情歌。所以,这样的好作品如果不去看,不多读,岂不是太可惜了吗?
icon声音定制要求icon
录制内容
按停顿-读-停顿两秒的循环过程,依次朗读100句文本并生成音频。录制文本:可自行选择,也可请参照附录2文本,语句越多训练效果越好。文本要求:中文汉字文本。单句子最长不超过50字,平均句子控制在20字左右。音频个数:可一整段或拆分为几段音频均可。音频格式:WAV格式,48K采样率。
注意事项
环境一定要安静无杂音,也不要有回音;如遇到读错情况,可停顿两秒后该句子重新朗读一遍;每个句子中自然停顿两秒;语气自然,在录制时尽量保证前后语气一致;语速尽量适中,不能过快或者过慢;吐字清晰,保证台词读音正确;除了讲话之外,不要做其余动作,避免多余声音(如衣服摩擦等声音、吞咽声)。
icon附录2:声音定制文本icon
产品推荐 查看更多>>
    腾讯千帆河洛SPP SAAS应用场景连接器

    腾讯千帆河洛SPP场景连接可以通过一个可视化的画布配置界面,以无代码的方式,选择触发器和操作,使得场景方案可以在无人工干预下,按照预期自动化运行,场景连接器可以数字化连接企业SaaS应用,自动化串联全平台业务场景,打破信息孤岛,提升企业运转效率

    串联不同SaaS应用,数据无缝流转

    无需人工,自动触发智能运行

    提供大量基于业务场景的方案模板,开箱即用

    可视化操作,人人可用,无需代码知识

    腾讯云聚合支付解决方案

    腾讯云聚合支付解决方案,通过技术手段将银行和第三方支付机构的多种支付服务整合于一体的支付方式。包含证件 OCR 识别、活体检测、人脸1:1对比等能力,以解决行业内大量对用户身份信息核验的需求。E证通基于腾讯云人脸核身技术,为网络身份信息 EID 提供权威、统一、合规的身份信息核验服务的小程序服务。

    慧眼·人脸核身

    慧眼·E证通

    慧眼·意愿核身

    慧眼·要素核验

    腾讯云媒体处理MPS

    媒体处理(Media Processing Service,MPS)是一种云端音视频处理服务。基于腾讯多年音视频领域的深耕,为您提供极致的编码能力,大幅节约存储及带宽成本、实现全平台播放,同时提供视频截图、音视频增强、内容理解、内容审核等能力,满足您在各种场景下对视频的处理需求。

    极速高清智能编码

    极致的编码内核

    画质增强

    画质修复