
HVS 特性
视觉掩盖,人眼对单一视觉信号比较容易感知,当几个视觉信号同时存在时,HVS 会对其中一个或多个信号的感知能力下降甚至消失,感知阈值发生改变,包括:
- 亮度掩盖:人眼对较亮或者较暗区域感知更弱
- 纹理掩盖:人眼对非均匀区域的可见性阈值为 明显高于均匀区域
- Pattern 掩盖:人眼对规则物体的分辨力明显会高于不规则的物体
- 运动掩盖:人眼对剧烈运动的场景分辨力会明显下降
视觉注意,即当人眼注意视频场景时,人眼会快速将注意力集中在感兴趣的视频内容或者对象上。包括两种模式:
- 由外部激励驱动的自底向上(Bottom-up)的处理过程。主要跟图像内容的显著性相关,与周围区域具有较大差异性的目标容易吸引观察者的视觉关注。
- 由任务驱动的自上而下(Top-down)的处理过程。意识支配、依赖于特定的命令,由人的“认知因素”决定, 比如知识、预期和当前的目标,如监控场景下的人体更容易引起注意。
视觉感知编码
视觉感知编码的目的是利用已知的 HVS 特性,最大限度消除人眼无法感知的信息,用更少的比特资源提供视觉感知质量更理想的视频图像。为此,研究人员提出了大量的视觉感知编码方法。根据编码方法所利用的 HVS 特性不同,研究和应用比较多的是基于视觉掩盖的编码方法和基于视觉注意的编码方法。
关于视觉掩盖的编码方法,人眼多通道模型的特点,一个激励的存在将导致另一个激励探测阈值的改变,致使人眼对其中一种或多种激励的感知能力下降或消失,这就为消除视觉冗余提供了可能。目前,基于视觉掩盖的编码方法主要有:基于JND模型的编码方法和基于SSIM,VMAF等主观评价机制的编码方法。其中 JND 模型的编码方法是人眼视觉编码目前广泛使用的技术,也是我们重点研究的技术。
关于视觉注意的编码方法,根据是否考虑 HVS 的中央凹特性,基于视觉注意的编码方法可以分为两类,基于感兴趣区域的编码方法和基于人眼显著性检测的编码方法。
- 基于感兴趣区域(ROI)的编码方法的基本思想是在视频编码前,对输入的视频场景进行视觉感知分析确定感兴趣区域。在编码过程中通过调整编码参数,比如 QP,来分别控制感兴趣区域和非感兴趣区域的失真程度,进而改善感兴趣区域的编码质量。该技术提出已有多年,实际在使用时提升比较有限。
- 基于人眼显著性检测(Visual saliency detection)的编码方法指通过根据人的视觉特点,提取图像中的显著区域(即人类感兴趣的区域)。面对一个场景时,人类自动地对感兴趣区域进行处理而选择性地忽略不感兴趣区域,这些人们感兴趣区域被称之为显著性区域。该技术是是人眼感知编码中比较常见的技术,通常和 JND 等技术配合达到更好的压缩效果,也是我们要优先研究的技术。
NE264 技术
目前业界窄带高清技术已相对比较成熟,结合 NE264 编码特性以及想要达成的目标,我们的窄带高清技术主要分为三大部分:
- 视频增强前处理技术:纹理增强,提升主观体验
- 显著性检测技术:基于人眼视觉注意特性,区分显著性和非显著性区域,用于编码,提高压缩率
- JND感知编码技术:基于人眼视觉掩盖特性,作用于编码,提高压缩率
具体的流程我们可以结合下图看一下:对于输入视频,我们可以通过机器学习分析视频内容特性,然后进行视频增强前处理,以提升画质,再进行显著性检测区分显著性和非显著性区域,传递给 NE264 编码器,NE264 编码计算 JND 系数,再结合显著性检测结果,作用于编码,最终输出显示。
窄带高清技术
下图为增强前处理的对比效果图,其中左图为原图,右图为增强处理后的效果,可以发现经过视频增强处理后的图像主观得到明显提升。
视频增强效果
下图为显著性检测效果图,其中上面彩色图为原图,下面黑白图为显著性检测效果图,为 0-255 的值,越亮说明越是显著性区域。
显著性检测效果
04 JND 感知编码技术
下面我们就来看看上面提到的关键技术:JND 感知编码技术。
JND(Just Noticeable Distortion)为最小可觉察误差,用来度量人眼对图像中不同区域失真的敏感性,多用于基于视觉特性的图像/视频编码、数字水印、图像质量评价。目前已有多个 JND 模型被提出,主要分为两类,基于像素域的 JND 模型和基于 DCT 域的 JND 模型。
- 基于像素域的 JND 模型能在像素域上更为直观地给出每一个像素点的 JND 阈值,不需要考虑频域特性,计算简单方便,但精度不高。
- 基于 DCT 域的 JND 模型考虑频域特性,应用更广,通常包括三部分,亮度自适应(Luminance Adaptation, LA)、对比度掩蔽(Contrast Masking, CM)以及对比度敏感函数(Contrast Sensitivity Function, CSF)。我们主要采用的是基于 DCT 域的 JND 感知编码技术。JND 计算公式如下:

JND 计算公式
基于 NE264 的 JND 感知编码如下:对于输入的 YUV 图像,我们首先计算亮度敏感度、纹理敏感度和对比敏感度,从而得到 JND 系数,然后作用于 DCT 域,改变原有的 DCT系数,然后进行编码,输出码流。
基于 NE264 的 JND 感知编码
05 所以
本文主要介绍了 NE264 窄带高清技术和 JND 感知编码技术,对于直播点播应用而言,如何在保证高清画质的基础上尽可能地减少带宽始终是追求的目标,视频编码是其中至关重要的环节,不管是传统编码技术,还是结合智能编码技术,我们都将持续努力,带来更低时延、更高画质的优质视频体验。
以上就是本次分享的全部内容,到【网易云信】***【MCtalk】即可查看本次分享的视频回顾。
派优网部分新闻资讯、展示的图片素材等内容均为用户自发上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习交流。用户通过本站上传、发布任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请
联系我们一经核实,立即删除。并对发布账号进行封禁。
相关推荐
-
抖音app在不断更新的过程中增加了很多新的功能,除了之前更新的热搜、点赞、评论等功能,最近抖音正式上线转发功能,一起来看看新版抖音转发功能在哪里及其使用方法一览! 新版抖音转发功能…
-
爱美是女人的天性,而逛街又能通过买衣服、 买首饰、 做头发 让美丽成真,所以十个女人十个爱逛街,也不足为奇了 买衣服可以说是姐妹们最愿意做的事,衣柜里的衣服再多,总感觉自己还是没衣…
-
在电子商务领域,京东商城以其快速的物流配送和优质的客户服务赢得了广大消费者的青睐。然而,对于消费者来说,除了商品的价格和质量,运费也…
-
东西价格20,免运费,但当你把发货地址切换到新疆、西藏、甘肃、宁夏、青海、内蒙古这六个地区中的任意一个,付款时就变成了70,多了50的快递费。 这时,每个人都会吐槽一句,中国太大了…
-
-
阳春三月,春回大地,万物复苏,小鸟在风中舞蹈;小草悄悄的露出了脑袋,偷偷的笑了;小花揉揉双眼大声的叫着“春天真好”。一场春雨过后,在田野里、路边上,心急的荠菜也不甘落后,你争我抢的…
-
双鱼座是十二星座中的最后一个星座,它的太阳星座运势往往与梦想、感性和灵性有关。双鱼座的人通常都是非常敏感和善良的人,他们往往能够感受到别人的情感和需要,并且愿意为他人付出。 性格特…
-
护肤品这东西现在不仅女生用,男生也会用,但无论男女在面对买护肤品哪个平台比较可靠这一问题上,答案都是五花八门的,因为渠道很多。比如在专柜和旗舰店太贵,有些人会选择代购护肤品,但也可…
-
孩子,小编知道你正在经历人生中的一次重要的挑战,或许你有焦虑、有恐惧,也有激动,但小编想说,请不要忘记身边所有关心爱着你的人,他们都是你坚强的后盾! 一、鼓励高三学生拼搏的话 1、…
-
王者荣耀正式服即将上线的才女小姐姐上官婉儿的台词已经放出,作为一个潇洒的才女,上官婉儿无论在历史上还是游戏中都表现的非常出色,接下来就和腿毛一起来看看这个灵动的法师吧! 1、言为心…