金山云解析智能音视频的云转码解决方案

来源: 云巴巴 2019-09-17 13:54:23

不管是高清直播互动的兴起,或是超清晰视频、vr视频的爆发,人们追求更清晰的画面质量,更好的观看体验探索,一直在不断演变。据预测,到2022年,UHD将占现场视频IP流量的35%,这将导致带宽成本的快速增长。那么如何在高质量和低成本之间找到平衡呢?

在近日举办的多媒体技术峰会LiveVideoStackCon2019上,金山云技术总监蔡媛发表了《集智高清-以低带宽成本获取高清画质体验》的主题分享,从而解决了这一问题。并能以低带宽成本获得高清晰度图像质量体验云转码服务智能高清晰度.在演讲中,蔡媛深刻阐述了金山云集智高速节电的重大突破,并分享了各种视觉AI和编码技术,同时深入分析了智智高清的AI算法架构,包括如何使用全局深度学习算法,如噪声网络和局部去噪网络修复,提高视频质量,引入客观评价视频质量评估平台KQoE,推出干货技术主题共享。

5G前奏打开,AI+构建极端云转换解决方案

近年来,随着互联网技术的飞速发展,4K高清、VR视频、直播交互等多种音频和视频格式对网络带宽传输效率提出了更高的挑战。从1994年第一代视频编码标准MPEG-2推出,到2013年第三代标准HEVC/H.265 avs2升级,虽然压缩效率每10年增加一倍,但频宽的增长永远也赶不上业务的需要,更有效率的影音传输效率,一直处于音频和视频行业技术从业人员面前的问题。

“金山云基于对用户需求的深刻洞察,推出了能够以低带宽成本获取高清画质体验的云转码服务——集智高清,通过自研算法,整合AI、编码、图像处理等多种技术,融合深度神经网络对视频画面内容进行感知,优化主观体验和智能调节编码,对视频进行画质增强,提升视觉效果,适配更高清屏幕,带来更好视觉感受的同时,还可帮助客户节省50%视频传输带宽,广泛适用于绝大部分视频场景,”蔡媛介绍到,“通过对视频进行内容分类、质量对比和内容分割,匹配视频处理工具包,满足用户对超清视频画质和流畅播放体验的追求,同时大幅降低视频运营商的带宽成本压力。”

在内容分类方面,视频场景和复杂度由识别网络分为两层,以适应更好的图像质量改善和压缩效果。目前,包括综艺,游戏,表演,电影,体育等在内的视频场景得到了广泛的支持;在质量对比度方面,从色彩饱和度,对比度,噪声和清晰度的角度,实时监控和分析输入视频的客观质量,并输出质量得分作为视频参数调整的参考。加工工具;在内容分割方面,通过ROI区域检测,先将每帧的视频内容分层,然后根据人的视觉特征区分视频图像的主体和背景,使主体更加突出,背景更纯净,视频内容得到增强。更精致。最后,金山云提供的AI深度学习视频处理套件由超分辨率、去噪、模糊、锐化、对比度增强等算法模块组成。每种处理工具都可以灵活组合,适合各种视频丢失,有效地提高了视频绘画的质量。

为了更直观地展示图像和视频转码的效果,金山推出了kqoe平台,旨在为客户提供高效、易于使用的具有图像和视频效果评价需求的评价平台。利用更专业的评价平台能力,提高图像/视频评价效率。

创新的算法框架促进服务器编码技术的优化

为了满足多样化视频处理的需要,智能高清算法框架主要由视频分析仪和图像处理器两个模块组成。在处理流程中,视频分析仪根据视频类型、视频质量和ROI区域进行计算,而视频处理器将根。根据分析结果和输入处理策略,对视频进行预处理,然后发送到编码器进行编码,完成整个编码过程。云代码转换的优势在于场景中有足够的计算能力,与终端编码相比,可以很好地应对处理性能要求。

在云转码方案中,编码目标函数的优化是关键。“对于云代码转换,场景与采集端不同,其目标函数需要进行优化。初级优化即试图利用网络对失真图像进行处理,尝试恢复出原始图像,但是这样做往往容易造成过平滑,因此需要进一步对L2 loss进行优化,”蔡媛介绍到,“对此,我们改进目标函数的思路是,除了L2 loss外,需要加入Perceptual loss和GAN中的判别器loss,通过调整来达到真实业务需求的最优效果。”

接下来,蔡媛将重点放在图像处理模块中的去噪模块,该模块将从背景块区域的全局去噪网络和人脸区域的本地去噪网络中进行解释。“全局去噪网络需要保证网络的轻量级,甚至达到1080 p@25的实时处理,考虑到该模型需要适应不同类型和不同强度的噪声,我们最终基于内存网络的概念设计了网络模型的骨干网络。”蔡媛。由于人脸的像素数远小于整个视频的分辨率,所以视频中人脸的注意度很高。“因此,局部(人脸)去噪网络的设计不需要受到算法复杂性的限制。另外,由于人脸的先验知识很强,为了更完整地挖掘这些先验知识,我们需要采用更多的特殊设计。用多尺度鉴别器对GaN版进行了训练,并对其进行了测试和验证,证明在修复人脸的基础上,可以增强人脸的细节,进一步提高处理的主观效果。”

全面升级能力,打造面向未来的智能视频云平台

金山云智能高清致力于提供专业的云转码服务,以低带宽成本获得高清画面质量体验。该方案在易用性、可靠性和可扩展性等方面具有独特的优势。通过提供易于使用的转码控制台和丰富的客户端SDK,至少99.9%的服务可用性,以及为用户快速定制和优化方案的能力,它可以帮助客户大大降低成本并增强用户观看体验。

梁守星介绍,围绕人眼结构特性,金山云的集智高清产品正试图将编码、图像处理和AI整合,基于深度神经网络的画质增强技术,对视频内容进行感知,明显提升了主观效果和客观指标,带来更好的视觉感受,转码后视频码率、传输带宽可节省35% 50%。

蔡媛表示:“我们希望吉智高清成为视频行业的加速器,为客户的业务运营和行业的技术发展做出贡献。”作为视频云服务的领导者,金山云将继续投资于技术研发,通过更高效的产品和解决方案帮助客户做出更好的响应。移动视频的场景和需求日益复杂多样,给最终用户带来了更好的视觉感受。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

腾讯云直播中的腾讯实时音视频被应用在了哪些场景

腾讯云直播中的腾讯实时音视频被应用在了哪些场景

直播对于观众而言是放松身体的一种方式,对于主播而言则是自己热爱的一份事业甚至是一份工作。直播种类的不断增加不仅是观众爱好的丰富也能让主播的才艺得到了更好的展现,而且越来越多的直播种类也让观众观看一场直播的同时有了更多的选择,可以通过自己的兴趣爱好选择一场直

2022-11-24 10:35:47

想要做直播的你,这些热门的音视频RTC产品千万别错过!

想要做直播的你,这些热门的音视频RTC产品千万别错过!

实时互动,也就意味着用户需要在应用里通过视频或者语音实现互动行为,这对于直播平台而言绝非易事,除了自行开发费时费力以外,实时音视频技术本身的复杂程度也让直播平台很难保证提供给用户良好的使用体验。

2022-09-15 17:08:03

在云点播技术中音视频的转码工作非常重要(二)

在云点播技术中音视频的转码工作非常重要(二)

关于云点播技术技术,您了解相关的内容吗?虽然云点播技术为我们能够流畅不卡的观看视频提供了一些帮助。但是对于一段视频的播放,云点播技术主要针对一段视频想要流畅稳定的播放经常会遇到的那个问题进行完善,而那个问题则是——音视频的转码与处理。

2022-11-24 10:52:50

2021腾讯云618活动中,音视频通信产品有哪些优惠?

2021腾讯云618活动中,音视频通信产品有哪些优惠?

此次腾讯云618特惠活动中,所有音视频通信产品6.2折起!

2022-11-24 14:02:49

牛赞:腾讯云实时音视频TRTC前端跨平台技术应用

牛赞:腾讯云实时音视频TRTC前端跨平台技术应用

LiveVideoStackCon 2021北京站邀请到腾讯云高级工程师——牛赞,为我们分享利用Flutter如何进行实时音视频渲染,并深入底层,优化视频渲染的性能。

2022-01-14 18:04:12

腾讯云实时音视频中稳定流畅观看直播依靠这些功能(二)

腾讯云实时音视频中稳定流畅观看直播依靠这些功能(二)

想要流畅的观看一场直播,或许网络速度、屏幕分辨率会成为我们首先考虑的两大方面。在网络环境并不是特别出色的场景下通过更改直播间的画质确实能对直播的流畅度起到一些帮助。然而虽然这是我们观看直播时非常好用而且有效的一个方法,但是观看直播是流畅了,画质却奈何只能被

2022-11-24 10:51:08

严选云产品

用户实体行为分析系统 UEBA 是垂直领域的分析者,提供端到端的分析,从数据获取到数据分析,从数据梳理到数据模型构建,从得出结论到还原场景,自成整套体系,提供用户行为跟踪分析的最佳实践,记录了人产生和操作的数据,并且能够进行实际场景还原,从用户分析的角度来说非常完整并且直接有效
指掌易 制造业移动安全管理解决方案 指掌易制造业移动安全管理解决方案,业内领先的虚拟安全域技术,业务应用及数据的访问基于应用状态、网络状态、时空状态等条件实施准入。实现应用数据的存储加密,对应用调用系统功能,自动运行设置等进行控制 。对企业存在多开需求场景,对应用实现双开或多开共存。
分贝通传统制造企业支出管理解决方案 分贝通传统制造企业支出管理解决方案,统一预算管控+多种消费规则+灵活审批的全流程费控优势,分贝通10%无法使用企业支付的场景可通过轻量级费用报销全部解决。移动端报销随时随地,多端审批、后台归档,财务更省心,员工导入发票更便捷,费用报销更高效,审批流程查看更简单。
蓝墙互联Julius房地产建设管理系统 蓝墙互联Julius房地产建设管理系统,理顺主项与专项计划模板间、前后置节点间的关联关系;所有项目,主项、专项计划,一应俱全,全面掌握;支持按节点完成百分比多次汇报,手机小程序一键汇报。绑定施工现场视频设备,手机端实时查看工地现场情况。
网御星云内网安全管理系统ISM 网御内网安全管理系统(以下简称:ISM),是网御星云依据在终端安全管理和建设相关领域多年的实践经验,自主研发的业界领先的内网安全管理产品。ISM提供了完整的传统桌面管理,终端数据防泄露,终端防病毒一体化解决方案,满足客户的行业合规需求,全面解决终端安全问题。
阿拉校园大学生校园全场景大数据服务平台 阿拉校园大学生校园全场景大数据服务平台作为高校智慧校园的底层基础数据服务平台,提供校园全场景大学生行为大数据服务。涵盖早操、课堂、晚自习、就寝、图书馆、活动、实习、在线阅读、在线学习等线上线下校园场景,借助云计算、移动互联网、身份识别、精准定位、大数据等相关技术,为学校学风建设、学生安全、教学改革、就业服务、行为预警、精准资助、干预分析、信用评估、学生综素测评、学生评优等提供全面真实可靠的过程数据,为高校真正实现智慧教育和人本教育提供底层技术和数据支撑。

甄选10000+数字化产品 为您免费使用

申请试用