金山云解析智能音视频的云转码解决方案

来源: 云巴巴 2019-09-17 13:54:23

不管是高清直播互动的兴起,或是超清晰视频、vr视频的爆发,人们追求更清晰的画面质量,更好的观看体验探索,一直在不断演变。据预测,到2022年,UHD将占现场视频IP流量的35%,这将导致带宽成本的快速增长。那么如何在高质量和低成本之间找到平衡呢?

在近日举办的多媒体技术峰会LiveVideoStackCon2019上,金山云技术总监蔡媛发表了《集智高清-以低带宽成本获取高清画质体验》的主题分享,从而解决了这一问题。并能以低带宽成本获得高清晰度图像质量体验云转码服务智能高清晰度.在演讲中,蔡媛深刻阐述了金山云集智高速节电的重大突破,并分享了各种视觉AI和编码技术,同时深入分析了智智高清的AI算法架构,包括如何使用全局深度学习算法,如噪声网络和局部去噪网络修复,提高视频质量,引入客观评价视频质量评估平台KQoE,推出干货技术主题共享。

5G前奏打开,AI+构建极端云转换解决方案

近年来,随着互联网技术的飞速发展,4K高清、VR视频、直播交互等多种音频和视频格式对网络带宽传输效率提出了更高的挑战。从1994年第一代视频编码标准MPEG-2推出,到2013年第三代标准HEVC/H.265 avs2升级,虽然压缩效率每10年增加一倍,但频宽的增长永远也赶不上业务的需要,更有效率的影音传输效率,一直处于音频和视频行业技术从业人员面前的问题。

“金山云基于对用户需求的深刻洞察,推出了能够以低带宽成本获取高清画质体验的云转码服务——集智高清,通过自研算法,整合AI、编码、图像处理等多种技术,融合深度神经网络对视频画面内容进行感知,优化主观体验和智能调节编码,对视频进行画质增强,提升视觉效果,适配更高清屏幕,带来更好视觉感受的同时,还可帮助客户节省50%视频传输带宽,广泛适用于绝大部分视频场景,”蔡媛介绍到,“通过对视频进行内容分类、质量对比和内容分割,匹配视频处理工具包,满足用户对超清视频画质和流畅播放体验的追求,同时大幅降低视频运营商的带宽成本压力。”

在内容分类方面,视频场景和复杂度由识别网络分为两层,以适应更好的图像质量改善和压缩效果。目前,包括综艺,游戏,表演,电影,体育等在内的视频场景得到了广泛的支持;在质量对比度方面,从色彩饱和度,对比度,噪声和清晰度的角度,实时监控和分析输入视频的客观质量,并输出质量得分作为视频参数调整的参考。加工工具;在内容分割方面,通过ROI区域检测,先将每帧的视频内容分层,然后根据人的视觉特征区分视频图像的主体和背景,使主体更加突出,背景更纯净,视频内容得到增强。更精致。最后,金山云提供的AI深度学习视频处理套件由超分辨率、去噪、模糊、锐化、对比度增强等算法模块组成。每种处理工具都可以灵活组合,适合各种视频丢失,有效地提高了视频绘画的质量。

为了更直观地展示图像和视频转码的效果,金山推出了kqoe平台,旨在为客户提供高效、易于使用的具有图像和视频效果评价需求的评价平台。利用更专业的评价平台能力,提高图像/视频评价效率。

创新的算法框架促进服务器编码技术的优化

为了满足多样化视频处理的需要,智能高清算法框架主要由视频分析仪和图像处理器两个模块组成。在处理流程中,视频分析仪根据视频类型、视频质量和ROI区域进行计算,而视频处理器将根。根据分析结果和输入处理策略,对视频进行预处理,然后发送到编码器进行编码,完成整个编码过程。云代码转换的优势在于场景中有足够的计算能力,与终端编码相比,可以很好地应对处理性能要求。

在云转码方案中,编码目标函数的优化是关键。“对于云代码转换,场景与采集端不同,其目标函数需要进行优化。初级优化即试图利用网络对失真图像进行处理,尝试恢复出原始图像,但是这样做往往容易造成过平滑,因此需要进一步对L2 loss进行优化,”蔡媛介绍到,“对此,我们改进目标函数的思路是,除了L2 loss外,需要加入Perceptual loss和GAN中的判别器loss,通过调整来达到真实业务需求的最优效果。”

接下来,蔡媛将重点放在图像处理模块中的去噪模块,该模块将从背景块区域的全局去噪网络和人脸区域的本地去噪网络中进行解释。“全局去噪网络需要保证网络的轻量级,甚至达到1080 p@25的实时处理,考虑到该模型需要适应不同类型和不同强度的噪声,我们最终基于内存网络的概念设计了网络模型的骨干网络。”蔡媛。由于人脸的像素数远小于整个视频的分辨率,所以视频中人脸的注意度很高。“因此,局部(人脸)去噪网络的设计不需要受到算法复杂性的限制。另外,由于人脸的先验知识很强,为了更完整地挖掘这些先验知识,我们需要采用更多的特殊设计。用多尺度鉴别器对GaN版进行了训练,并对其进行了测试和验证,证明在修复人脸的基础上,可以增强人脸的细节,进一步提高处理的主观效果。”

全面升级能力,打造面向未来的智能视频云平台

金山云智能高清致力于提供专业的云转码服务,以低带宽成本获得高清画面质量体验。该方案在易用性、可靠性和可扩展性等方面具有独特的优势。通过提供易于使用的转码控制台和丰富的客户端SDK,至少99.9%的服务可用性,以及为用户快速定制和优化方案的能力,它可以帮助客户大大降低成本并增强用户观看体验。

梁守星介绍,围绕人眼结构特性,金山云的集智高清产品正试图将编码、图像处理和AI整合,基于深度神经网络的画质增强技术,对视频内容进行感知,明显提升了主观效果和客观指标,带来更好的视觉感受,转码后视频码率、传输带宽可节省35% 50%。

蔡媛表示:“我们希望吉智高清成为视频行业的加速器,为客户的业务运营和行业的技术发展做出贡献。”作为视频云服务的领导者,金山云将继续投资于技术研发,通过更高效的产品和解决方案帮助客户做出更好的响应。移动视频的场景和需求日益复杂多样,给最终用户带来了更好的视觉感受。

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

评论列表

为你推荐

腾讯云直播中的腾讯实时音视频被应用在了哪些场景

腾讯云直播中的腾讯实时音视频被应用在了哪些场景

直播对于观众而言是放松身体的一种方式,对于主播而言则是自己热爱的一份事业甚至是一份工作。直播种类的不断增加不仅是观众爱好的丰富也能让主播的才艺得到了更好的展现,而且越来越多的直播种类也让观众观看一场直播的同时有了更多的选择,可以通过自己的兴趣爱好选择一场直

2022-11-24 10:35:47

想要做直播的你,这些热门的音视频RTC产品千万别错过!

想要做直播的你,这些热门的音视频RTC产品千万别错过!

实时互动,也就意味着用户需要在应用里通过视频或者语音实现互动行为,这对于直播平台而言绝非易事,除了自行开发费时费力以外,实时音视频技术本身的复杂程度也让直播平台很难保证提供给用户良好的使用体验。

2022-09-15 17:08:03

教育机构如何有效利用音视频和CDN加速技术提升在线教育技术能力?

教育机构如何有效利用音视频和CDN加速技术提升在线教育技术能力?

实时音视频TRTC和即时通信IM组成一套适合在线教育通用的音视频录播和直播方案,结合CDN加速可以解决境外加速,直播卡顿和大体量直播互通问题,提升教育机构的在线教育技术能力。

2022-11-24 14:17:03

即时通信IM和实时音视频TRTC组合保障鸿星尔克网络直播间稳定

即时通信IM和实时音视频TRTC组合保障鸿星尔克网络直播间稳定

点赞、评论数据量不断攀升,网友誓死也要把流量刷上去。突如其来大量的点赞评论刷屏,鸿星尔克的直播间依然稳如狗,画面流畅还能清晰展示物品细节,由此可见直播也是一门技术活。从技术层面来说他背后的架构并不简单,都是即时通信IM与实时音视频TRTC的功劳。

2022-11-24 14:13:41

腾讯云实时音视频中稳定流畅观看直播依靠这些功能(二)

腾讯云实时音视频中稳定流畅观看直播依靠这些功能(二)

想要流畅的观看一场直播,或许网络速度、屏幕分辨率会成为我们首先考虑的两大方面。在网络环境并不是特别出色的场景下通过更改直播间的画质确实能对直播的流畅度起到一些帮助。然而虽然这是我们观看直播时非常好用而且有效的一个方法,但是观看直播是流畅了,画质却奈何只能被

2022-11-24 10:51:08

在云点播技术中音视频的转码工作非常重要(一)

在云点播技术中音视频的转码工作非常重要(一)

云点播对于观众而言作为一种新型的视频播放方式,和传统的播放方式相比云点播技术在画质以及视频的流畅度方面进行了优化,而这也让我们观看视频时的卡顿现象得到了很好的控制。在云点播技术中,通过对视频中画质以及音质编码的处理从而提高我们的观看体验。

2022-11-24 10:54:29

严选云产品

腾讯云慢直播LCB(直播监控) 慢直播LCB(直播监控)是腾讯云针对大规模音视频上行的直播方案,专为音视频高并发推流场景而定制,提供符合GB28181、X-P2P 协议的摄像头 / 边缘视频网关的接入、实时大小屏观看、云录像回看、AI 智能分析的能力,广泛应用于安防监控、旅游 景区直播、智慧门店分析等领域。
百家云氢元数据数字品牌管理系统 百家云氢元数据数字品牌管理系统充分运用大数据、人工智能等前沿技术,全面提升舆情感知与舆情精细化管控能力。7*24h 舆情监测、危机预警以及分析报告等。同时有危机处置、口碑维护等。
默安科技 尚付容器安全管理系统CNPP 默安科技尚付容器安全管理系统能力覆盖容器生命周期中的三个关键阶段,即:容器构建时的镜像安全、容器部署时基线检查以及运行时的入侵检测和防御。为容器安全提供全天候监测与保护,构建基于云原生的容器安全防护。
鲁班监测 鲁班监测(Luban Monitor)针对基建工程的监控量测,将BIM模型和监控系统相结合,面向项目全过程,以满足项目管理层和企业管理层管理项目的监测需求,实现实时、直观浏览监测信息,实现多样性和及时性的预警监测,实现自动生成图表监测报告。
大型机自动化 UiPath为大型机自动化提供API和云。它可通过UI自动化集成任何大型机,如T3700、绿屏、Java和传统应用。
ITC商业中心解决方案 ITC商业中心解决方案,针对商场中视频形式多样,无法统一管控、指引不清晰、发布内容单一等方面痛点,itc通过资产商务管理平台作为信息发布平台提供平台统一管控,主要覆盖商场电梯、商场中厅、楼层过道等区域。 具有强大的后台管理、商铺管理、商品管理、用户管理等,整合一套完整的资产商务管理平台。

甄选10000+数字化产品 为您免费使用

申请试用