恐怖谷理论:人们对机器人的正面情感随着其类人程度的增加而增高,但当达到一个较高的临界点时,其残存的非类人特征会变得十分显眼,引起人们强烈的不适感。梅拉宾法则:也叫 7/38/55 理论,意思是沟通的时候只有 7% 是通过文字本身传递的,说话的语速、语音、声调传达了剩下的 38%,另外 55% 是形象。
“灵泷”快速三维人体扫描系统,针对当前数字人制作周期长,自动化程度低,严重依赖人员经验等问题,搭建的人体全身采集系统。通过摄像机阵列扫描真实演员,突破图像阵列采集、表情自动绑定、语义控制器自动关联等关键技术,实现一键拍摄快速重建高逼真数字人。
表情重构在数字人建模过程中极其重要。人脸是柔性体,其表情变化极为复杂微妙,难以直接控制。数字栩生数字人4D表情采集系统,通过构建表情变化与语义控制器之间的绑定对应关系,实现虚拟数字人的动态表情绑定和自动生成,解决了数字人行业批量化生产的核心问题。
单张照片数字人生成服务,是一种基于人工智能的单张图片生成人脸模型及贴图的软件。用户可以上传一张自己的照片,软件就会自动生成对应的模型和贴图。该服务简化了人脸模型和贴图的制作流程,减少了所需要的数据量,让用户无需使用专业仪器就可便捷地创建专属于自己的数字人。
根据客户需求,提供超写实数字人定制服务,使用数字孪生、实时渲染、智能驱动等技术,实现超写实数字人快速生成及内容快速生产服务,并提供数字人服务的SaaS平台和用于支持用户业务的终端程序。
当前服务型虚拟数字人可以完成许多类型的工作,并且在很多应用场景中具有积极意义,尤其是客户服务这类需要投入大量人力资源的场景。服务型虚拟数字人的应用可以极大的节省人工成本,降低企业的经营压力,真正促进整个服务系统向更好的方向发展。
数字栩生开发了完整的基于可扩展行为树的数字人智能行为驱动系统,可将各种AI能力作为元件进行快速组装,为虚拟数字人提供更加智能化和模块化的交互能力,帮助各行各业打造更具差异化的数字人资产。
数字人智能软件服务平台HaaS(即Human as a Service),依托数字栩生先进的数字人快速生成及智能驱动技术,可为用户提供虚拟数字人的形象定制和内容生产服务。企业用户可通过单张照片快速创建数字人,并基于HaaS软件订阅服务,在AI驱动下快速生成播报视频等数字内容,一站式助力企业布局元宇宙生态。
数字栩生已经与上百家来自互联网、游戏、金融、汽车、政务等行业的客户达成合作,已经发布和正在制作的专属数字人IP接近50个。包括微软、英伟达、 虚幻引擎、央视、新华社、奔驰、腾讯、字节跳动、爱奇艺等头部客户在内,参与打造了“数字梅兰芳”、“李星澜”、“春草”、次世文化“翎Ling”,新华社“小诤”、芒果TV“小萨”等国内顶尖的数字人项目。
“数字梅兰芳”是由中戏、北理工、数字栩生、中科院自动化所等单位联合发起的一项公益性探索项目,旨在通过高保真数字人技术,对京剧大师梅兰芳先生进行复现,打造在外貌、形体、语音、表演等各方面都接近真人的“梅兰芳孪生数字人”。探索传承中华文明精神与京剧国粹文化的创新传播业态,并希望以此为典范构建“中国人物”数字资产库。
蔚领时代发布中国首款电影级云原生游戏《春草传》,“春草”作为中国第一个数字演员,在和导演试戏的五分钟里,对于导演给出的喜怒哀乐命题均能进行精细化的情绪表现。
李星澜是字节跳动游戏厂牌“朝夕光年”团队开发的科幻生存游戏《星球: 重启》里的超级人工智能,她拥有来自未来的“AI大脑”,是一个既智能又真实的虚拟数字人。在游戏世界里她会为玩家提供帮助,而在现代世界中,她又会作为AI虚拟代言人在社交平台与大众互动。
奔驰虚拟数字人“Mercedes”项目由奥美广告(北京)有限公司牵头,与数字艺术家柳迪及其导演工作室ROOMs Studio制作出品,数字栩生提供动作捕捉及数据驱动服务。“Mercedes”作为奔驰品牌「未来研习官」,用第一视角带领用户探索超现实的虚拟世界,解锁了一场科技与汽车行业融合的数字艺术发布会,开创了行业的先例。
打造数字栩生自有IP形象,帮助企业客户快速打造具有差异化的虚拟数字人,为丰富多样的元宇宙生态提前做数字人资产储备。以下所有数字人均系我司从模型雕刻、贴图材质、表情绑定到UE5实时渲染的全流程制作项目。目前,公司已有20+超写实数字人IP和10+美型数字人IP,客户可按需挑选使用。
行业先发,扫描数百个演员,积累数万个表情数据,构建数据壁垒
2024年完成完整的国人3D和4D数据集建设,积累数万人静态数据
自研核心技术,实现数字人逼真的面部表情及动作互动
核心技术1:三维光场重建系统快速生产高质量数字人
核心技术2:“四维采集”结合“自动解算”,高精度脸部特征采集:自主开发了脸部标记点跟踪识别系统,捕捉标记点的运动信息;开发了适应的半自监督训练方法和数据生成方法。端到端语言驱动对话口型:创建针对中文语音的驱动面部模型方法,保留语音的时间相关性,复原逼真、准确和自然的嘴唇动作和面部驱动。基于因素连续性搜索的语音口型生成方法:输入文字的音素序列,在语料库中查找音素或视素相同的数据,自动生成口型与表情。
牵头多个国家级数字人科研项目,与政府共同推动数字人规范化
腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。
腾讯云ASR识别准确率业界领先,支持的方言、语种也十分丰富
为企业提供极具性价比的语音识别服务
被微信、王者荣耀、腾讯视频等大量内部业务使用
外部落地录音质检、会议实时转写、语音输入法等多个场景