不管是高清直播互动的兴起,或是超清晰视频、vr视频的爆发,人们追求更清晰的画面质量,更好的观看体验探索,一直在不断演变。据预测,到2022年,UHD将占现场视频IP流量的35%,这将导致带宽成本的快速增长。那么如何在高质量和低成本之间找到平衡呢?
在近日举办的多媒体技术峰会LiveVideoStackCon2019上,金山云技术总监蔡媛发表了《集智高清-以低带宽成本获取高清画质体验》的主题分享,从而解决了这一问题。并能以低带宽成本获得高清晰度图像质量体验云转码服务智能高清晰度.在演讲中,蔡媛深刻阐述了金山云集智高速节电的重大突破,并分享了各种视觉AI和编码技术,同时深入分析了智智高清的AI算法架构,包括如何使用全局深度学习算法,如噪声网络和局部去噪网络修复,提高视频质量,引入客观评价视频质量评估平台KQoE,推出干货技术主题共享。
5G前奏打开,AI+构建极端云转换解决方案
近年来,随着互联网技术的飞速发展,4K高清、VR视频、直播交互等多种音频和视频格式对网络带宽传输效率提出了更高的挑战。从1994年第一代视频编码标准MPEG-2推出,到2013年第三代标准HEVC/H.265 avs2升级,虽然压缩效率每10年增加一倍,但频宽的增长永远也赶不上业务的需要,更有效率的影音传输效率,一直处于音频和视频行业技术从业人员面前的问题。
“金山云基于对用户需求的深刻洞察,推出了能够以低带宽成本获取高清画质体验的云转码服务——集智高清,通过自研算法,整合AI、编码、图像处理等多种技术,融合深度神经网络对视频画面内容进行感知,优化主观体验和智能调节编码,对视频进行画质增强,提升视觉效果,适配更高清屏幕,带来更好视觉感受的同时,还可帮助客户节省50%视频传输带宽,广泛适用于绝大部分视频场景,”蔡媛介绍到,“通过对视频进行内容分类、质量对比和内容分割,匹配视频处理工具包,满足用户对超清视频画质和流畅播放体验的追求,同时大幅降低视频运营商的带宽成本压力。”
在内容分类方面,视频场景和复杂度由识别网络分为两层,以适应更好的图像质量改善和压缩效果。目前,包括综艺,游戏,表演,电影,体育等在内的视频场景得到了广泛的支持;在质量对比度方面,从色彩饱和度,对比度,噪声和清晰度的角度,实时监控和分析输入视频的客观质量,并输出质量得分作为视频参数调整的参考。加工工具;在内容分割方面,通过ROI区域检测,先将每帧的视频内容分层,然后根据人的视觉特征区分视频图像的主体和背景,使主体更加突出,背景更纯净,视频内容得到增强。更精致。最后,金山云提供的AI深度学习视频处理套件由超分辨率、去噪、模糊、锐化、对比度增强等算法模块组成。每种处理工具都可以灵活组合,适合各种视频丢失,有效地提高了视频绘画的质量。
为了更直观地展示图像和视频转码的效果,金山推出了kqoe平台,旨在为客户提供高效、易于使用的具有图像和视频效果评价需求的评价平台。利用更专业的评价平台能力,提高图像/视频评价效率。
创新的算法框架促进服务器编码技术的优化
为了满足多样化视频处理的需要,智能高清算法框架主要由视频分析仪和图像处理器两个模块组成。在处理流程中,视频分析仪根据视频类型、视频质量和ROI区域进行计算,而视频处理器将根。根据分析结果和输入处理策略,对视频进行预处理,然后发送到编码器进行编码,完成整个编码过程。云代码转换的优势在于场景中有足够的计算能力,与终端编码相比,可以很好地应对处理性能要求。
在云转码方案中,编码目标函数的优化是关键。“对于云代码转换,场景与采集端不同,其目标函数需要进行优化。初级优化即试图利用网络对失真图像进行处理,尝试恢复出原始图像,但是这样做往往容易造成过平滑,因此需要进一步对L2 loss进行优化,”蔡媛介绍到,“对此,我们改进目标函数的思路是,除了L2 loss外,需要加入Perceptual loss和GAN中的判别器loss,通过调整来达到真实业务需求的最优效果。”
接下来,蔡媛将重点放在图像处理模块中的去噪模块,该模块将从背景块区域的全局去噪网络和人脸区域的本地去噪网络中进行解释。“全局去噪网络需要保证网络的轻量级,甚至达到1080 p@25的实时处理,考虑到该模型需要适应不同类型和不同强度的噪声,我们最终基于内存网络的概念设计了网络模型的骨干网络。”蔡媛。由于人脸的像素数远小于整个视频的分辨率,所以视频中人脸的注意度很高。“因此,局部(人脸)去噪网络的设计不需要受到算法复杂性的限制。另外,由于人脸的先验知识很强,为了更完整地挖掘这些先验知识,我们需要采用更多的特殊设计。用多尺度鉴别器对GaN版进行了训练,并对其进行了测试和验证,证明在修复人脸的基础上,可以增强人脸的细节,进一步提高处理的主观效果。”
全面升级能力,打造面向未来的智能视频云平台
金山云智能高清致力于提供专业的云转码服务,以低带宽成本获得高清画面质量体验。该方案在易用性、可靠性和可扩展性等方面具有独特的优势。通过提供易于使用的转码控制台和丰富的客户端SDK,至少99.9%的服务可用性,以及为用户快速定制和优化方案的能力,它可以帮助客户大大降低成本并增强用户观看体验。
梁守星介绍,围绕人眼结构特性,金山云的集智高清产品正试图将编码、图像处理和AI整合,基于深度神经网络的画质增强技术,对视频内容进行感知,明显提升了主观效果和客观指标,带来更好的视觉感受,转码后视频码率、传输带宽可节省35% 50%。
蔡媛表示:“我们希望吉智高清成为视频行业的加速器,为客户的业务运营和行业的技术发展做出贡献。”作为视频云服务的领导者,金山云将继续投资于技术研发,通过更高效的产品和解决方案帮助客户做出更好的响应。移动视频的场景和需求日益复杂多样,给最终用户带来了更好的视觉感受。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-24 10:35:47
2022-09-15 17:08:03
2022-11-24 10:52:50
2022-01-14 18:04:12
2022-11-24 10:51:08
甄选10000+数字化产品 为您免费使用
申请试用
评论列表