分类号: 密 TN919 UDC: 级: 公开 11646 单位代码:______________ 硕士专业学位论文 论文题目:基于 HEVC 的码率控制算法 学 号: 1411082704 姓 名: 陈伟国 专 业 名 称: 学 院: 电子与通信工程 信息科学与工程学院 指 导 教 师: 陈 芬 合 作 导 师: 彭宗举 论文提交日期:2017 年 5 月 19 日 A Thesis Submitted to Ningbo University for the Master’s Degree Rate Control Algorithm based on HEVC Candidate: Weiguo Chen Supervisors: Professor Fen Chen Faculty of Information Science and Engineering Ningbo University Ningbo 315211, Zhejiang P.R.CHINA Date: May 19, 201 宁波大学硕士专业学位论文 致 谢 本 论文是 在陈芬 副教授 和彭宗 举教授 的悉心 指导 和关怀 下完成 的。三年来 ,两 位 恩 师在学 习上、生活上 给了我 无微 不至的 关心和 帮助,对我的 成长倾 注了大 量心 血 。我与 陈芬老 师的接 触可以 追溯 到研究 生复试 阶段,是她给 我迷茫 的求学 道路 指 明了方 向,她 以博大 的胸 怀和犀 利的眼 光分析 了科研 的前景 和需要 克服的 难关 , 坚 定了我 的人生 追求。在 生活中, 陈老师 平易近 人,对我更 是关照 有加,教 导我 如 何做人 。彭 老师老 师兢兢 业业 ,对 学术具 有执着 的理念 ,无 论是授 课还是 修改 论 文都是 一丝不 苟,是我 学习的 榜样,给 我学习 的最大 动力。在此, 向尊敬 的陈 芬 和彭宗 举两位 老师表 示衷心 的感谢 和最诚 挚的 敬意。其次,要感谢 给该论 文评 审 的每位 专家以 及从开 题答辩 以来为 我把关 的每 位专家 老师,是您们 百忙之 中抽 出 宝贵的 时间在 本论文 的立意 上、创新价 值上、书写规 范以及 语言表 达上给 予我 诚 恳的指 导和帮 助,让我 精益求 精,认真 完成每 一细节,借 此论文 致谢,特 意感 谢 你 们 , 祝 愿各位 专家老 师身体 健康、 工作进 步。 再 次,感谢 宁波大 学电路 与系统 研究所 的老师 们,他们 是:蒋刚毅 老师、邵 枫 老 师、郁梅 老师。每次 向他们 请教 科研中 的问题,他 们都悉 心指导, 对我的 研究 工 作提出 了很多 好的建 议和中 肯的意 见。我不仅 向他们 请教科 研中的 问题,而且 也 从他们 那里汲 取很有 价值的 人生经 验,他们对 我的生 活和身 体也给 予很多 的关 心 和帮助 ,给我 的研究 生活注 入了 更多的 朝气和 动力。蒋刚毅 老师不 仅是一 个很 好 的科研 榜样 ,还是 一个热 爱生活 的人 ,他 用朝气 和坚定 鼓舞着 我,让我时 刻以 他 为 榜 样 努 力学习 。 最 后,感谢 研究所 的同学 们,他 们是:焦 仁直、金 德富、 陈嘉丽、 李金龙、 高 颖、 李鹏、 田维军、 刘珊 珊、何美 玲、王 颖、刘晟 、沈立 波、胡晴 晴、王 静、胡 天 佑、左立 文、潘 志勇、林 文崇、 袁其政、 宋昊、 刘珍、杨 家辉、 许晴晴、 车慧 丽 、 杨桐 、汤 锐彬 、宋 阳、 李 长阳 、姜 求平 、于 娇文 、黄 超 、王 士培 、陈 婉婷 、 谢 登梅 、陈璐 俊、管 非凡等 。他 们和我 一起学 习和生 活,是我最 值得感 谢的朋 友。 还 要感谢 我的父 母和亲 人以及 女朋友 对我求 学的 理解和 帮助,对我学 业及生 活温 暖 的 照 顾 、 关心和 支持。 谨以此 文表达 内心的 感激 之情。 - 53 - 宁波大学硕士专业学位论文 基于 HEVC 的码率控制算法 摘 要 随 着人们 对视频 服务消 费水平 的提高 ,人 们也热 衷于追 求高分 辨率视 频。视 频 分辨率 的增加 ,给 视频的 存储和 传输 带来了 很大的 挑战 。目前 ,如 何使编 码产 生 的码流 符合带 宽要求 是视频 编码中 的研究 热点 。码率 控制成 为了解 决此问 题的 关 键,码率控 制通过 控制编 码量化 参数 ,使 输出码 率接近 带宽大 小,充分利 用带 宽 。本文 通过研 究新一 代视频 编码标 准 HEVC 的 帧内码 率控制 算法, 提出了 相关 的 改 进 算 法 和策略 。主要 包括两 部分: 1) HEVC 帧内码 率控制 算法 并没有 考虑视 频内容 的复杂 度,率 失真性 能还可 以 进一步 提升。 针对此 问题,本 文提出 了基 于复杂 度分析 的 HEVC 帧 内码率 控制 算 法。根据梯 度因子 来表征 编码帧 复杂 度,梯度越 大说明 帧的复 杂度越 高,在分 配 时需要 更多的 比特来 维持质 量。首先通 过图像 复杂度 和比特 之间的 近似线 性关 系 ,为每 一帧合 理分配 比特 。再根 据帧内 实际分 配比特 与预分 配比特 之差自 适应 更 新平滑 窗口,使帧与 帧之间 的比 特波动 减小。最后结 合基本 单元层 的码率 控制 算 法及时 调节码 率。与 Li 算 法 相比,对 于相同 的 PSNR 值,所 提算法 平均可 以节 省 2.3%的 码率 ,最大 可以节 省 2.9%的 码率 。视频 的客观 质量平 均可 以提 高 0.08dB, 最 大 可 以 提 高 0.12dB。整 体码率 波动性 比 Li 要 好 , 比特 误差进 一步减 少。 2) 为 了有效 解决 HEVC 中的码 率控 制算法 没有考 虑视频 特征保 护的问 题,提 出 了基于 特征保 护的 HEVC 码 率控 制算法 。通过 获取特 征点掩 膜,结 合 HEVC 码 率 控制算 法的三 层比特 分配框 架。根据 特征点 分布情 况给每 个 LCU 分 配不同 的权 重 ,提 高 LCU 的匹配 效率。在不显 著降低 视频主 客观质 量的前 提下,尽可能 提高 视 频特征 点的保 护数量 。实验 结果表 明,所 提算 法与平台 HM15.0 相 比,在 时间 复 杂度可 接受范 围内 ,匹 配率有 所提高 ,平 均提 高 1.27%,保护了 更多的 特征点 , 提 升 了 算 法 的性能 。 关 键词:高 效视频 编码, 码率 控制, -I- 特征保 护, 比特误 差, 复杂度 基于 HEVC 的码率控制算法 Rate Control Algorithm based on HEVC Abstract As the consumption level on video services increases, people are keen to pursue high resolution videos nowadays. However, the large amount of high resolution video data brings new challenges to video storage and transmission. At present, how to make the coding stream to meet the bandwidth requirement is a hot topic in video coding. Rate control becomes the key to solving this problem, through controlling the quantization parameter, the output rate is close to the bandwidth. In this paper, through the studies of intra frame rate control algorithms for the new generation of video coding standard HEVC, some algorithms and strategies are proposed. The contribution of this paper includes two parts: 1) HEVC intra rate control algorithm does not consider the complexity of video content, rate distortion performance can be further enhanced. To solve the problem, this paper proposed the intra-frame rate control algorithm of HEVC based on the complexity analysis. Firstly, the gradient factor is used to represent the complexity of coding frame, the greater the gradient is, the higher the frame complexity gets. Bits are allocated reasonably for each frame according to the approximate linear relationship between image complexity and bits. Then the smoothing window is adaptively updated according to the difference between the actual allocated bits and the pre allocated bits to reduce the bit fluctuation. Finally, combined with the basic unit layer rate control algorithm adjusts the rate in time. Compared with Li’s algorithm, for the same PSNR value, the proposed algorithm can save the bit by 2.3% on average, the maximal bit rate saving reach 2.9%. The objective video quality can increase 0.08dB on average and 0.12dB at most. The overall rate fluctuation is lower than Li’s algorithm, and the bit error is further reduced. 2) In order to effectively solve the problem that the rate control algorithm in HEVC does not take into account the video feature protection, a rate control algorithm based on feature protection is proposed. By acquiring the feature point mask, combining the three-layer bit allocation model of HEVC rate control algorithm. According to the distribution of feature points for each LCU assign different weights to improve the matching efficiency of LCU. Under the premise of not reducing the subjective and objective quality of video, the number of video feature points can be improved as much as possible. The experimental results show that compared with HM15.0 platform, within the acceptable range of time complexity, the proposed algorithm increases the matching rate by 1.27%. Hence more feature points can be protected and the performance of the algorithm is enhanced. Key word: HEVC, rate control, feature protection, bit error, complexity - II - 宁波大学硕士专业学位论文 目 引 录 言 ................................................................................................. - 1 - 1 绪 论 ................................................................................................. - 3 1.1 选题 背景................................................................................... - 3 1.2 国内 外码率 控制研 究进展 .......................................................... - 5 1.3 论文 的主要 工作及 创新之 处 ....................................................... - 8 1.4 论文 的结构 安排 ........................................................................ - 8 2 HEVC 视 频编码 标准及 其码率 控制技 术 ............................................ - 10 2.1 新一 代视频 编码标 准 HEVC ..................................................... - 10 2.1.1 HEVC 编 码框架 ............................................................... - 11 2.1.2 HEVC 关键 技术 ............................................................... - 12 2.2 率失 真优化 技术 ...................................................................... - 18 2.3 码率 控制技 术.......................................................................... - 21 2.3.1 比特 分配 ........................................................................ - 22 2.3.2 参数 确定以 及更新 阶段 ................................................... - 24 2.4 本章 小结................................................................................. - 25 3 基 于复杂 度分析 的 HEVC 帧内 码率控 制算法.................................... - 26 3.1 复杂 度分析 及算法 优化 ............................................................ - 26 3.2 窗口 更新策 略.......................................................................... - 28 3.3 实验 结果及 其分析 ................................................................... - 29 3.4 本章 小结................................................................................. - 35 4 基 于特征 保护 的 HEVC 码率控 制算法 .............................................. - 36 4.1 特征 掩膜的 提取 ...................................................................... - 36 4.1.1 特征 点提取 分析 .............................................................. - 36 4.1.2 特征 掩膜分 析 ................................................................. - 39 4.2 HEVC 码率控 制算法 的修 正 ...................................................... - 40 4.3 实验 结果分 析.......................................................................... - 41 4.3.1 实验 配置 ........................................................................ - 41 4.3.2 结果 及分析 ..................................................................... - 41 4.4 本章 小结................................................................................. - 45 5 总 结与展 望..................................................................................... - 46 5.1 本文 工作小 结.......................................................................... - 46 - 基于 HEVC 的码率控制算法 5.2 未来 研究展 望.......................................................................... - 47 参 考文献 ............................................................................................ - 48 在 学研究 成果 ..................................................................................... - 52 - 宁波大学硕士专业学位论文 引 言 进 入21世 纪,多媒体 技术丰 富了人 们的 生活 ,多媒 体服务 随处可 见,如多媒 体 会议 、可视 电话、 手机 、远程 教学 及家庭 数字电 视等 。人类 知识 的获取 80%都 与 视觉直 接相关 ,多 媒体中 视频内 容的 信息量 也是最 大。但是实 际上 ,视频 的数 据 量很大 ,不 利于视 频在网 络中的 实时 传输 。比如 ,一 部90分 钟的电 影 (分辨 率为 1920×1080,假 设3个彩色 分量的 每个像 素均用 8比 特表示 ),需要几 百 G的 数据量 , 再 大的硬 盘也承 受不了 这么大 的数据 量,更无法 将原始 视频放 在网络 上传输 。虽 然 带宽在 不断提 高,存 储容量 也在 进一步 增长,但是仍 旧跟不 上视频 数据量 的变 化, 所以视 频必须 经过压 缩处理, 适当降 低视频 质量,才能 进行存 储和传 输。过 去 视频的 分辨率 较低 ,经过 压缩后 ,码流可 以在网 络中进 行传输 ,不 会对视 频的 质 量造成 很大的 影响,但是高 分辨 率视频 的出现 ,使得 早先的 视频压 缩标准 越来 越 不能满 足当代 的需要 ,迫切 地需 要最新 的视频 编码标 准进一 步提高 压缩比 。针 对 此问题,在2013年,国际 电联组 织 (ITU-T)和移 动视频 专家组 (Moving Picture Experts Group,MPEG)成 立 的 视 频编 码 联合 小组 (Joint Collaborative Team on Video Coding, JCTVC) 联 合 推 出 了 最 新 的 视 频 编 码 标 准 — 高 效 视 频 编 码 (High Efficiency Video Coding,HEVC)。视频编 码的 主要目 的是利 用像素 与周围 像素以 及已编 码帧对 应像 素 值之间 的联系 ,在视 频质量 可接 受范围 内提高 压缩效 率。除 非一些 重要的 应用 场 所,比如珍 贵的遥 感、来之不 易的 医学视 频等需 要保留 全部信 息之外 ,其 他人 们 实际接 触的视 频,比 如广告 、电影 、监控 等都 是经过 编码压 缩处理 后的视 频。 网 络多媒 体应用 的种类 越来越 多,用户的 要求也 越来越 高,当 初的标 清视频 已 经不再 满足人 们的需 要,视 频分辨 率需要 向更 高方向 发展。 视频分 辨率越 大, 意 味着编 码产生 的码流 越大 。然而 在实 际的网 络传输 中,带宽有 一定的 限制 ,如 果 编码产 生的码 流大于 带宽的 峰值 ,则会 造成视 频的阻 塞,从 而只能 丢弃视 频的 某 些信息 ,根 据码流 的重要 性,丢弃 优先级 较低的 信息再 进行传 输,这样做 的后 果 可能会 使编码 后的码 流无法 解析 。因为 视频某 些重要 信息的 丢失,会使视 频播 放 不流畅, 出现卡 壳、停顿和 马赛 克等效 果,影响观 看质量。 如果编 码产生 的码 流 小于带 宽的峰 值,带宽利 用不充 分 ,也会 造成视 频质量 的下降 。为 了解决 此问 题 ,码 率控制 算法应 运而生 ,其 主要 目的是 通过采 取一定 的手段 ,控 制输出 的比 特 数,使得编 码后产 生的码 流尽可 能的 等于带 宽的大 小,充分利 用带宽 ,改 善视 频的性能。 本 毕 业论 文 主要 研究 HEVC的 码 率控 制 算法 ,主 要 从两 个方 面 展开 讨论 ,第 一 ,针 对帧 内比 特分 配问 题,提 出基 于复 杂度 分析 的 HEVC帧 内码 率控 制算 法。 -1- 基于 HEVC 的码率控制算法 充 分考虑 复杂度 ,利用 复杂度 因子 分配帧 层的比 特,然 后结合 自适应 平滑因 子进 一 步调整 码率, 最后结 合基本 单元层 的码率 控制 算法, 改善视 频的率 失真性 能, 提 高码率 控制的 精度 。第二 ,结 合当 前研究 热点-计 算机视 觉,提出了 基于特 征保 护 的 HEVC码率 控制 算法 ,对标 准码 率控 制算 法进 行了 改进, 提高 了特 征点 的保 护 数量。利 用尺度 不变特 征变 换(Scale Invaria nt Feature Transfor m, SIFT) 算法 提 取特征 掩膜,根 据掩膜 把 LCU分 成不同 的优先 级,根据 LCU级别自 适应分 配比 特 , 在 码 率 受限的 情况下 ,更好 地保护 视频的 特征 点数量 。 -2- 宁波大学硕士专业学位论文 1 绪论 虽 然传输 带宽传 递数据 的能力 在逐年 提升 ,但是 随着视 频逐渐 向清晰 化方向 发 展,带 宽的更 新速度 远远没 有视 频的数 据量发 展快。如何在 保证频 质量的 前提 下 ,减少 视频数 据量, 使编码 产生的 码流与 带宽 相适应 是当前 的热点 研究问 题, 本 文研究 了 HEVC 帧内、帧间的码 率控制 技术。本 章首先 对论文 的选题 背景进 行介 绍 ,阐述 了码率 控制技 术在国 内外 的研究 进展,接着介 绍本论 文的主 要工作 以及 创 新 之 处 , 最后给 出了论 文的结 构安排 。 1.1 选题背景 随 着电子 显示、信息采 集技术 的快 速发展 ,视频 序列的 分辨率 从以前 的标清 逐 渐向高 清、 甚至超 高清方 向普 及 [1]。 在信 息化时 代,多 媒体视 频应 用往往 受到 人 们的青 睐,例如每 天腾讯 视频的 浏览 量高达 数千万 次。一些大 的事件 ,比 如演 唱 会、军事 演习、抗震 救灾等, 人们总 是能通 过动态 影像获 得相当 多的信 息。但 是 随着视 频向高 清方向 发展,未 经压 缩的视 频数据 量庞大,在带宽 受限的 情况下 , 无 法将视 频直接 用于传 输和存 储,人们也 就无法 通过网 络获取 自己所 需的视 频信 息 。只 有更进 一步压 缩视频 ,提 高视 频的压 缩效率 ,才 能在网 络中更 好的传 输视 频 数据量 。为 此,ITU-T 和 MPEG 成 立的 视频编 码联合 小组 [2] 于 2013 年联合 制定 了 新一代 视频编 码标准 —HEVC[3],标 准致 力于压 缩高清 视频信 息,去 除视频 的时 空 域冗余 ,减 少视频 的数据 量,便于 视频的 传输和 存储 。由于 人眼视 觉的掩 蔽效 应 ,就 算丢失 部分视 频细节 信息 ,也 不会影 响观看 的效果 ,却 能增加 视频的 压缩 效 率 , 所 以 HEVC 视 频编 码标准 将广泛 应用到 视频多 媒体服 务中。 视 频在网 络中传 输时 ,网络 带宽的 限制 会降低 视频质 量,影响观 看效果 。如 果 编码产 生的码 流大于 带宽 ,就会 在传 输过程 中堵塞 数据 ,造成 数据丢 失,严重 时 可影响 视频的 解码播 放,当码流 小于 带宽时 ,又 会造成 视频质 量下降 。所 以在 编 码时应 该考虑 实际带 宽大小 控制编 码输出 的码 率,这 就是码 率控制 的作用 。码 率 控制就 是根据 带宽的 大小 ,自适 应调 节编码 参数 ,逐层 分配比 特,在失真 尽量 小 的前提 下,使得编 码产生 的码率 等于 带宽大 小,既不造 成带宽 资源的 浪费 ,又 不 造成视 频传输 的阻塞 和丢包 ,正 是因为 码率控 制技术 ,高清 视频才 能通过 网络 传 输到世 界各地 。如 图 1.1 所示, 码率控 制根据 信道带 宽和一 些错误 隐藏机 制以 及 视频信 源的特 性来控 制编码 的量化 参数 ,使视 频序列 经过编 码器后 产生的 码流 符 合 带 宽 要 求: -3- 基于 HEVC 的码率控制算法 视频序列 视频编码器 码流 网络传输 视频解码器 重建序列 QP 信道带宽 视频信源特性 码率控制 错误隐藏机制 图 1. 1 码 率 控 制 模 块 Fig1.1 Rate control module 码 率控制 的主要 任务是 根据目 标码率 确定编 码的 量化参 数,一 般来说 码率控 制 方案可 以分为 三个步 骤:比特 分配,根据目 标比特 数确定 每个编 码单元 的比特 。 在 实际的 分配过 程中,首先把 比特 分配到 一个固 定长度 的图像 组,然 后通过 帧在 图 像组所 占的比 重把比 特分配 给每一 帧,最后到 每一个 编码单 元,通 过三层 比特 分 配,可以提 高比特 的控制 精度和 利用 效率 。计算 量化参 数,根据比 特和量 化参 数 的关系 模型,确定每 个编码 单元 的量化 参数,用此量 化参数 进行编 码产生 的比 特 总和就 接近于 目标比 特。参 数更 新,利 用已编 码单元 的相应 参数更 新当前 编码 单 元 的 参 数 ,进一 步提高 预测准 确性, 提高压 缩性 能。 码 率控制 算法优 劣的评 价指标 有码率 控制的 精度、率失真 性能、码 率波动 性、 客 观质量 和主观 质量等 。由于 模型 参数的 不准确 性,码 率控制 算法在 精度方 面还 有 提升空 间,控 制精度 从整 体上理 解就是 实际编 码产生 的比特 与目标 比特之 间的 误 差大小 ,从细 节上理 解就 是当前 帧甚至 当前编 码单元 预先分 配比特 与实际 消耗 比 特之间 的误差 大小 ,误差 大,说明 控制精 度不好 。率 失真性 能的提 高意味 着在 码 率一定 的情况 下,编 码输出 的视频 客观质 量越 好,或 者在失 真一定 的情况 下, 码 率节省 得越多 。码率 的波动 性越 好意味 着每一 帧产生 的比特 方差较 小,视 频的 质 量波动 性较好 。如 果视频 波动性 较大 ,意 味着某 些帧的 比特数 过高 ,不适 用于 在 带 宽 限制 条 件下 的 传输 视 频流 。 客观 质 量的 主 要评 价 标准 是 峰值 信 噪比 (Peak Signa l to Noise Ratio, PSNR),给 定的目 标比特 下, PSNR 越大 ,说明 经过编 码后 视 频的 质量 越高 ,PSNR 越小 ,说明 编码 后视 频失 真较 大,质 量下 降。 主观 质量 主 要是通 过人工 打分判 断图像 质量的 好坏 ,但是 人工带 有主观 色彩,比如观 察时 间 过长 ,观察 者眼睛 感到疲 劳,会与 实际结 果产生 偏差 ,所以 有时并 不正比 于客 观 质 量 评 价 标准。 -4- 宁波大学硕士专业学位论文 1.2 国内外码率控制研究进展 目 前,码 率控制 是国内 外研究 的热 点课题 ,很多 专家学 者都为 其发展 进步做 了 很多研 究创新 工作 ,针对 一些具 体应 用场合 ,提 出了很 多的码 率控制 算法 。现 有 的码率 控制策 略中经 常用到 的模型 有:以 量化参 数为参 数的 R-Q 模型 [4]-[8 ]。以 变 换后的 离散余 弦变换 (Discrete Cosine Trans for m,DCT)系 数 中零的 比例 ρ 为 参数 的 R- ρ 模 型 [ 9]-[12] 以拉格 朗日乘 子为参 数的 R-λ 模型 [ 13]-[16] 。 学 者 围 绕码 率控 制 的评 价 标准 -码 率控 制 的精 度 和主 客 观质 量两 个 方面 进行 了 很多 研究 。为 了提高 码率 控制 的精 度,文 献 [17]根据 线性 模型提 出了 基于 内容 复 杂度的 码率控 制方法 ,该方 法适合于 MPEG 系列编 码标准 。文献 [18]针对 码率 控 制算法 在精度 控制方 面效果 不佳的 问题, 提出 一种图 像自适 应码率 控制算 法, 能 够 更 加 准 确 地 控 制 输 出 码 率 。 文 献 [19] 通 过 探 索 码 率 、 复 杂 度 和 量 化 参 数 (Quantization Parameter,QP)之间 的联系 ,在 R-Q 模 型的基 础上提 高了码 率控制 的精 度 。文 献 [20]提出 基于结 构相 似度 的博 弈论方 法, 充分 考虑 了不同 编码 树单 元的 率 失真特 性,进 一步优 化最大 编码单 元 (Largest Coding Unit,LCU)层 的 比特分 配, 该 方 法 在 码 率 控制 的 精 度 、 编码 复 杂 度 和视 频 质 量 稳定 性 等 方 面具 有 较 好 的性 能 。文 献 [21]针对 数字病 理图 像提 出分 区域编 码模 型, 对感 兴趣区 域精 细编 码, 对 非感兴 趣区域 粗编码 。该算 法在 保持感 兴趣区 域质量 的前提 下,提 高了码 率控 制 的精度 。文献 [22]提出 了基于 梯度的 R-λ 模型 ,该方 法提 高了 HEVC 的帧 内编 码 性能, 减少 了比特 估计错 误。 针对复 杂的视 频场 景,文 献 [23]建 立复杂 度、QP 和 码率 之间 的模 型,所 提出 的算 法减 少了比 特误 差。 文献 [24]从率 失真 理论 分析 的 角度推 导出影 响输出 码率的 主要因 素,通过预 测视频 内容的 复杂度 参数,提出 了 帧层 码率 分配 算法, 使目 标码 率与 编码码 率保 持更 好的 一致性 。文 献 [25]提出 了 帧内联 合码率 估计模 型 ,可以 减少比 特误差 。文 献 [26]发 现 LCU 层 的纹理 复杂 度 和编码 比特存 在近似 线性关 系,利用 此关系 ,提 出自适 应比特 分配模 型,通过 考 虑时空 相关性 和纹理 复杂度 ,该 模型可 以取得 更好的 编码性 能和更 小的比 特误 差 。文 献 [27]利用 时空相 关性 和运 动信 息,提 出基 本单 元层 的码率 控制 算法 ,该 算 法 可 以 减 小目标 比特和 分配比 特之间 的误差 。 为 了在 带宽 受限 的情 况下提 高视 频的 主客 观质量 ,文 献 [28]利用 纹理 信息和 运 动信息 度量宏 块的视 觉敏感 程度 ,在基 本单元 层根据 敏感度 因子分 配比特 ,可 以 提高压 缩视频 的主观 质量,也能 进一步 减少质 量波动 ,提高 人眼关 注度高 的区 域 质量 。文 献 [29]通过分 析编 码比 特跟 纹理复 杂度 的线 性关 系,提 出自 适应 比特 模 型,同时 利用复 杂度 模型决 定初始 化的 QP,最 后修 正 QP 的 范围来 进一步 改善 编 码性 能。 文献 [30]针对 特定 的视 频会 议系统 ,提 出了 改善 人脸区 域视 频质 量的 -5- 基于 HEVC 的码率控制算法 码 率控制 算法 ,在保 证整体 码率偏 差较 小的情 况下 ,提高 了人脸 区域的 质量 。文 献 [31]通过 分析已 编码 LCU 的失 真与 λ 之间的 线性关 系,建 立失真 与 λ 之间 的模 型 ,所 提出 的算 法在给 定的 比特 下改 善了视 频的 质量 。文 献 [32]通 过肤 色信 息和 帧 差来确 定感兴 趣区域 (Regio n of Interest, ROI)的 掩膜,对 于 ROI 区 域分配 更多 的 比特资 源,通过这 种方法 ,在不 提高计 算复 杂度的 情况下 ,可以 提高 ROI 区域 的 视觉 质量 。文 献 [33]通 过帧 差法 检测 出运动 区域 和非 运动 区域, 然后 根据 复杂 度 将非运 动区域 分为平 坦区域 和复杂 区域 。对三 个区域 根据视 觉敏感 权重分 配比 特 ,可以 改善视 频的主 客观质 量。文 献 [34]提 出了自 适应 的 R- Q 模型 预测帧 内比 特, 建立量 化参数、 宏块和 复杂度 之间 的关系, 通过减 小 ROI 区 域的 QP 值,分 配 更多 的比 特, 从而更 好的 维持 感知 质量。 文献 [35]为 了改 善主观 视觉 质量 ,提 出 感知比 特分配 方案 ,用级 联人脸 检测器 提取 出 ROI 区域 ,通 过比特 分配来 优化 ROI 区 域,实 验结 果此方 案可以在 ROI 区域获 得更好 的客观 质量。 文献 [36]提出 的 RIO 码率 控制算 法,重点保 护视频 会议场 景的人 脸区域 ,把 编码单 元分成 两个 区 域, 人脸区 域设 置小的 QP, 该算 法可 以提高 人脸 区域的 主观 和客观 质量 。文 献 [37]认为 HEVC 码率控 制时, I 帧比特 分配过 多,视 频整体 质量波 动较大 ,为 了 解决此 问题 ,所以 把 I 帧的 LCU 根 据其运 动情况 和复杂 度分成 三个区 域,然后 分 配不 同的 比特 ,减少 质量 波动 的同 时,可 以提 高视 频的 主客观 质量 。文 献 [38] 根 据纹理 把 CU 分 成不同 类型,对纹理 区域和 非纹理 区域提 出帧层 码率控 制算法 , 实 验结果 表明该 算法可 以带来 客观质 量的提 升, 对于场 景变换 有很好 的适应 性。 文 献 [39]根据 权重 映射图 分配 比特 ,提 出的方 法可 以分 配更 多的比 特给 人脸 关注 度 高的 区域 ,可 以提高 人脸 部的 视觉 质量。 文献 [40]提 出了 失真和 帧间 相关 性的 比 特率模 型,并 把它纳 入 ρ 域码 率控制 方案。该方案 可以提 高关键 参考帧 的质量 , 并 且产生 良好的 率失真 性能。 文献 [41]提出了 基于 H.265/HEVC 帧级 比特分 配算 法 。通 过理论 分析帧 间相关 性的具 体特 征,建立比 特分配 模型 ,提高 视频的 客观 质 量。文 献 [42]认为在 超高画 质电视 序列中 , HEVC 在码 率控 制性能 方面有 所欠 缺 ,分 别在帧 层比特 分配和 参数初 始化 方面对 其作出 改善 ,提高 率失真 性能 。文 献 [43]考 虑已 编码 帧的相 关信 息来 衡量 当前帧 的复 杂度 ,算 法可以 改善 视频 的质 量 ,并且 可以节 省比特 。文献 [44]通过 考虑 I 帧和 P 帧 的复杂 度以及 两种类 型帧 之 间的联 合复杂 度,建立复 杂度模 型 ,根据 复杂度 分配比 特,所提算 法可以 减小 PSNR 的 波动 。文献 [45]利 用 RBF 神经网 络的方 法来提 高 ROI 的 编码质 量,相比 于 传统的 算法 ,在 RIO 区域视 频质量 、率 失真性 能和比 特控制 精确度 方面都 有所 提高。 -6- 宁波大学硕士专业学位论文 另 外针 对 HEVC 可分 级视频 编码 的扩展 (Scalable HEVC,SHVC)[46 ]中码 率控制 技 术也有 很多学 者对其 进行了 研究 [47 ]-[50] ,文献 [49]认 为 λ 是确 定比特 率和相 应的 失 真的关 键因素 ,通过 考虑 SHVC 的时域 、空域 的相关 性,发 现增强 层图片 之间 λ 的比例 与当前 帧对其 他增强 层图 片的影 响成正 比例关 系。而 在基础 层的图 片 λ 的 比例与 当前图 像的基 本层和 增强层 图像的 影响 成正比 例关系 。根据 以上思 想提 出 的比 特分 配算 法可以 提高 视频 的性 能。文 献 [51]首先 优化 每层第 一帧 的目 标比 特 和编码 参数 ,然后 考虑帧 内、帧间 的层次 依赖性 ,最 后在空 间和质 量可扩 展性 的 情况下 ,提出 了比特 分配优 化算 法,可 以带来 更好的 率失真 性能和 更准确 的比 特 控制。 为了获 得持续 视频质 量的输 出,文 献 [52]提出了 基于 λ 的低 延时码 率控 制 算法, 在基本 单元层 ,通过 建立失 真与 λ 之间的 新模型 ,减小 了 PSNR 的 偏差 和 编码帧 之间的 质量波 动。类似的 通过建 立模型 来提高 编码质 量波动 的研究 文献 还 有 [53][54 ]。文献 [55]提出 LCU 层的比 特分配 优化算 法,建立更 好的码 率与失 真之 间 关系 ,根据 码率与 失真的 模型分 类比 特,所提算 法在率 失真性 能、码率控 制精 度 、鲁 棒性 方面 都有所 改善 。文 献 [56]为了改 善帧 级码 率分 配问题 ,通 过考 虑帧 间 的相关 性,利用对 偶近端 算法 ,找 到码率 失真模 型的精 确解 ,提出 了一个 基于 凸 优化 的帧 层比 特分配 算法 。文 献 [57]认为编 码时 间会 影响 失真以 及码 率, 建立 了 一 个 关 于 编码时 间、失 真和码 率之间 的模型 ,可 以取得 更高的 编码效 率。 随 着智能 手机和 无线网 络的发 展,视频 传输的 要求越 来越高 。比 如,在无线 情 况下 传输 视频 ,对码 率控 制是 一个 考验, 文献 [58]研 究了 如何在 尺度 变化 的情 况 下保护 图像的 特征,通过分 析特 征的不 同特性 ,再根 据特征 的重要 程度分 别用 不 同的 QP 进行 编码, 可以 有效的 保护特 征区域 ,最后 结合人 眼视觉 感知系 统改 善 视频 的质 量。 文献 [59]认为 柯西 分布 能够更 加准 确的 描述 码率跟 量化 参数 之间 的 关系 ,所以 提出了 新的码 率控制 算法 ,在 一定程 度上也 能提高 视频的 质量 。还 有 文献考 虑了频 域特征 ,比如文 献 [60]认 为在频 域中 ,经 过 DCT 变换 后的交 流系 数 可以直 观的表 示空间 相关性 ,所 以利用 交流系 数跟直 流系数 的一个 比值来 表示 空 间的复 杂程度 ,如 果这个 块交流 系数 越大 ,说明 这个块 纹理越 复杂 。然后 在时 域 利用运 动矢量 来表征 块的运 动情况 ,利 用当前 块的相 邻块的 运动矢 量跟前 一帧 对 应块的 运动矢 量的权 重来自 适应表 示当前 块的 运动矢 量,再 用两者 的加权 来表 示 实际 的复 杂度 ,从而 改善 编码 性能 。文献 [61]认 为混 合的 拉普拉 斯模 型需 要更 多 的参数 预测, 计算复 杂度比 较高, 所以通 过改 进拉普 拉斯模 型,再 根据 KL 距 离 差异性 分析来 描述 DCT 变换系 数。从分 层编码 结构中 ,根据 帧在不 同层次 上质 量 相关性 ,结 合视频 的内容 ,在 文献 [62]的基础 上,自适应 改变质 量相关 性因子 , 提 高模型 的预测 准确性 和视频 的质量 ,并 且进一 步提高 的码率 分配的 性能。文献 -7- 基于 HEVC 的码率控制算法 [63]针对 立体 图像 编码, 提出 了有 效的 比特分 配方 法, 主要 集中在 参考 和残 余图 像 之间的 比特分 配,通过寻 找导致 最小 失真值 的最优 速率 ,改善 视频的 质量 ,所 提 算 法 适 合 立体编 码结构 。 1.3 论文的主要工作及创新之处 本 论文主 要从 HEVC 的 码率控 制角度 展开研 究。通过探 索发现 ,HEVC 中的 码 率控制 算法没 有考虑 视频编 码内容 的复杂 度 ,为此 ,提 出了基 于复杂 度的 HEVC 帧 内码率 控制算 法。经过进 一步探 索发 现,在计算 机视觉 的应用 领域 ,计算 机获 取 物体的 特征后 进行相 应的操 作,而 HEVC 中的 码率控 制并没 有对特 征保护 制定 相 应的算 法,为此 ,提 出了基 于特征 保护 的 HEVC 帧内码 率控制 算法 ,更好 地保 护 视 频 特 征 。本论 文的研 究内容 及创新 之处如 下: 1) 传 统的码 率控制 算法通 过比特 分配、参数更 新等步 骤,在码 率输出 的精度 和 效 率 上 都 取 得不 错 的 效 果 ,但 是 算 法 并没 有 考 虑 到实 际 视 频 编码 内 容 的 复杂 度 。针对 此问题 ,提出 了基于 复杂度 的 HEVC 帧 内码率 控制算 法。利 用梯度 表征 复 杂度,按照复 杂度合 理分配 码率 ,根据 产生的 实际比 特和预 分配比 特自适 应地 更 新平滑 窗口,结合基 本单元 层的 码率控 制算法 及时调 节码率 ,从而 使输出 码率 尽 可能与 目标码 率相等 。 与 Li 算法相比,对于相同的 PSNR 值,所提算法平均可以 节省 2.3%的码率,最大可以节省 2.9%的码率。视频的客观质量平均可以提高 0.08dB, 最高可以提升 0.12dB,并且进一步减小了比特误差。 2) HEVC 码率 控制算 法并没 有考虑 特征保 护问题 ,导致 编码后 的视频 与原始 视 频之间 的特征 匹配率 偏低 ,影响 后续 视频处 理算法 的性能 。针 对此问 题,提出 了 基于特 征保护 的 HEVC 码 率控制 算法 ,首先 通过 SIFT 算法 获取特 征点的 分布 情 况,提取 特征点 掩膜。然 后结合 LCU 层比 特分配 算法,增 加包含 特征点 的 LCU 的权重,减小 当前块 的量化 参数,分配更多的比特给特征区域。在 满足比 特限制 和维 持 主客观 质量的 情况下 ,使得 经过 信道传 输后的 视频保 持更多 的特征 点数量 。最 后 的结果 表明, 相比于 HM15.0 的 码率控 制算法 ,在视 频的主 客观质 量没有 显著 降 低的情 况下, 提出的 算法平 均可以 提高视 频的 匹配率 将近 1.27%, 更好的 保护 了特征区域。 1.4 论文的结构安排 本 论 文 共 分 为五章 ,重点 研究 HEVC 码率 控制算 法。结 构安排 如下: 第 一 章 首 先 介 绍 了 论文 的 选 题 背 景, 接 着 阐 述 了国 内 外 码 率 控制 的 研 究进 展 , 然 后 介 绍了论 文的主 要工作 以及创 新之处 ,最 后给出 了论文 的结构 安排。 -8- 宁波大学硕士专业学位论文 第 二章介 绍了 HEVC 视频编 码标 准及其 码率控 制技术。 首先介 绍了视 频编码 标 准。接 着介绍 了率失 真优化 技术, 最后介 绍了 HEVC 码率控 制算法 ,包括 比特 分 配 和 参 数 更新过 程。 第 三章 对 HEVC 码率 控制算 法展 开研究, 通过进 一步探 索,提 出了一 种基于 复 杂度 的 HEVC 帧内 码率控 制算 法。在帧 层,根 据复杂 度合理 分配码 率,利 用实 际 比特和 预分配 比特之 差自适 应地更 新平滑 窗口 ,再结 合基本 单元层 的码率 控制 算 法及时 调节码 率,减 小比特 误差, 最后给 出了 本方案 的实验 结果和 具体分 析。 第 四章 提出 了特 征保 护的 HEVC码率 控制 算法 。首 先通 过计 算获 取视 频序列 的 特征点 ,根 据特征 点分布 情况 ,提 取特征 掩膜 。然后 根据特 征点分 布情况 对图 像 进行 分块处 理, 最后改 进 LCU层 比特分 配算 法,提 高视 频特征 点的 保护数 量。 最 后 对 实 验 结果进 行了分 析与说 明。 第 五章对 本文进 行了总 结。本 章总 结了论 文的研 究工作 ,并提 出了进 一步研 究的方向。 -9- 基于 HEVC 的码率控制算法 2 HEVC 视频编码标准及其码率控制技术 随 着计算 机的发 展,互 联网以 及通信 技术的 创新 ,从 2000 到 现在, 视频分 辨 率快速 升级,对视频 压缩性 能提 出了更 高的要 求。为 了充分 满足广 大人民 群众 对 日益增 长的视 频服务 需求 ,ITU-T 和 MPEG 成立的 视频编 码联合 小组 于 2013 年 联 合 推 出了 最 新的 视 频编 码 标准 —HEVC, 相 对于 H.264/AVC[64 ]视 频 编码 标 准, HEVC 在 其 基础上 可将压 缩效率 提高一 倍以 上。为 了达到 此目标 , HEVC 在 H.264 的 基础上 ,对 很多环 节都增 加了改 进措 施,比如增 加帧内 预测的 方向 ,增加 块的 尺 寸、采 用更大 的块进 行变换 等。本 章首先 介绍 新一代 视频编 码标准 HEVC,进 而 对 HEVC 编 码标准 中的关 键技 术进行 简要叙 述,接着 介绍率 失真优 化技 术,然 后 详 细 介 绍 码率控 制技术 ,最后 对本章 内容进 行小 结。 2.1 新一代视频编码标准 HEVC 虽 然以前 的视频 编码标 准在当 时能够 满足实 际的 需要,但是在 数字信 息产业 链 的高速 推动下 ,视 频应用 的趋势 会朝 着以下 几个方 向前进 ,第 一,视频分 辨率 的 增加,视频的 分辨率 从 720p 向更 大分辨 率发展 ,在一 些特殊 应用领 域甚至 出现 了 4K×2K 的 超高清 视频 ,比 如卫星 遥感视 频、医学分 析视频 等 。普通 的视频 播放 平 台,比如腾 讯、优酷等 网站能 根据 用户的 需要和 实际带 宽的大 小选择 流畅 、标 清 、高 清 、超高 清等不 同的视 频分辨 率进行 观看 ,人 们希望 看到更 加清晰 的视频 , 并 且现在 的硬件 条件也 进一步 成熟, 所以分 辨率 的增加 是当前 视频发 展的趋 势。 第 二,宏块 增加,如果 分辨率 不大,单 个宏块 可以表 示的信 息较多, 但是随 着分 辨 率的快 速增长 ,单个 块所表 示的 信息量 下降。并且块 的个数 也会随 着分辨 率的 增 加而指 数增长 ,在编码 过程中 ,会 出现更 多的时 空域冗 余 ,不利 于进一 步压缩 , 所 以视频 编码标 准的编 码块尺 寸需要 在以前 基础 上有所 提高,保持更 好的压 缩性 能。HEVC 中,块 的尺寸 已经调 整到最 大为 64×64,在以 后甚至 有可 能 128×128。 第 三,带宽的 增长总 是跟不 上视频 数据 量的发 展,视频在 网络中 传输时 ,带 宽限 制 是决定 性的制 约因素 ,如 何提高 带宽的 利用效 率也是 视频传 输需要 考虑的 重要 问 题之一 。尽管 H.264 压缩 效率优 异,深 受视频 相关产 业的喜 爱,但 是随着 视频 分 辨率向 超高清 方向的 推进 ,H.264 在压 缩效率 上有些 不足 。在 这种情 况下 ,HEVC 应 运而生 ,对于 高清、 甚至超 高清视 频,通过 增加或 者改 进关键 技术, HEVC 比 原来 H.264 的压 缩效率 更高 ,在保 持质量 接近的 情况下 ,视频 压缩效 率提高 一倍 以上。 - 10 - 宁波大学硕士专业学位论文 2.1.1 HEVC 编码框架 HEVC 视 频编 码标 准类 似于 以往 的国 际标 准, 其基 本框 架并 没有 大的 改变, 仍 然采 用混 合编 码框架 [3]。 HEVC 在这 些核 心模块 中引 入新 的编码 技术 ,进 一步 去 除视频 的空间 、时间 、统 计、结 构等冗 余,更 好地压 缩视频 数据。 HEVC 在整 个 编码过 程中 ,首 先把一 帧图像 分成若 干个不 重叠 的 LCU 块 。如果 采用帧 内预测 , 则 当前 LCU 的像素 值可以 参考相 邻块 已编码 的 LCU 像 素值, 预测当 前像素 值的 大 小。如 果采用 帧间预 测,则需 要参 考相邻 帧最匹 配的 LCU 的 信息。然后得 到原 始 图像与 预测图 像之间 的差值 ,即 预测残 差,因 为图像 的像素 点有很 强的空 间和 时 间相关 性,所以残 差很大 一部分 数据 是零 。残差 系数经 过变换 、量 化和熵 编码 得 到码流 ,还需 要对量 化后的 残差 系数进 行反量 化和反 变换,经过去 块滤波 和样 本 自适应 补偿, 最后与 预测值 相加得 到重构 图像, 得到参 考帧。 HEVC 视频 编码 框 图 如 图 2.1 所示 。 基本控制信息 编码器控制 + 量化的变换系数 变换/量化 熵编码 滤波控制 分析 帧内预测 去块滤波 /SAO滤波 90 信息 帧内估计 滤波 信息 反量化/ 反变换 帧内预测信息 运动 视频信号 输入 运动补偿 视频信号输出 运动估计 编码帧缓存 图 2.1 HEVC 视频编码框图 Fig.2.1 The coding strcture of HEVC - 11 - 基于 HEVC 的码率控制算法 2.1.2 HEVC 关键技术 1) 编 码 单 元 为 了提高 视频的 压缩效 率, HEVC 采 用灵活 的四 叉树结 构进行 图像编 码,这 更 加适 用于高 清视频 。 HEVC 标准 中, 图像编 码单元 分为 三种: 编码 单元 (Coding Unit,CU), 预 测 单 元 (Prediction Unit,PU)以 及 变 换 单 元 (Transform Unit,TU) [ 3 ] 。 CU 有四 种尺寸 大小, 分别为 8×8、16×16、32×32、 64×64,最 大的编 码块称 为 最大编 码单元 (Largest Coding Unit,LCU)。 大的 编码块 主要针 对于高 清视频 中的 平 坦区域 ,可 以提高 编码效 率,小的 编码块 主要针 对纹理 变化区 域,可以保 留图 像 的细节 ,提高图 像的质 量。一个编 码单元 由三个 部分组 成 ,分别 为亮度 编码块 、 对 应的色 度编码 块和相 关的句 法元素 。CU 块是否 继续分 割取决 于分割 标志 flag, 如果 flag 等 于 0,则 不再需 要对 CU 块 进行四 叉树划 分,如果 flag 的 值 不为 0,则 需 要将当前 CU 块分割 成四个 同样 大小的子 CU 块。四 叉树分 割有利 于提高 编码 的 性能 ,减少 所用的 比特数 。根 据图 像的不 同内容 ,划 分不同 大小的 编码单 元进 行 编 码 , 有 利于优 化视频 的编码 结构。 CU 划 分结 构如图 2.2 所 示。 64 LCU0 Cudepth=0 LCU1 LCU2 LCU3 图像边界 Cudepth=1 32 Cudepth=2 Cudepth=3 16 8 图 2. 2 编 码 树 单 元 分 割 结 构 图 Fig. 2. 2 Segmentation s truc ture of c oding tree unit PU 是进 行预测 的基本 单元, 包含了 CU 的 帧内预 测模式 、运动 矢量预 测等范 - 12 - 宁波大学硕士专业学位论文 畴 。PU 最 大不可 超过 CU 的大小 ,最小 为 4×4。对于 一个 2N×2N 的 CU,采 用帧 内 预测时 ,PU 有两种 可选 模式: 2N×2N、N×N;采用 帧间预 测时, PU 还 有另外 6 种 可选模 式: 2N×N、N×2N 和 其他四 种非对 称模式 ,PU 划分 模式如 图 2.3 所示。 在 某 些 场 景 中,非 对称的 预测模 式可以 进一步 提高 预测的 准确性 。 Intra 2N×2N N×N 2N×2N N×N Inter 2N×N N×2N 2N×nU 2N×nD nL×2N nR×2N 图 2. 3PU 划 分 模 式 Fig. 2. 3 PU partition mode TU 是 进 行 变换和 量化的 基本单 元, TU 的 尺寸灵 活变化 ,最大 为 32×32,最 小 为 4×4。TU 的尺寸 大,能够 更好的 将能量 集中,提 高压缩 的效率,但是会 损失 一 部分图 像的细 节;尺 寸小, 可以保 留更多 的图 像细节 。在实 际的编 码过程 中, TU 可 以 根据率 失真代 价大 小自适 应地 选择最 佳的尺 寸。 这种灵 活的 分割结 构, 既 可以充 分压缩 变换后 的残差 系数,提高编 码增益,又可以 保留图 像的部 分细节 , 提 高图像 的质量 。一 个 32×32 的 CU 划 分为多 个 TU 时 的四叉 树结构 如图 2.4 所 示。 32 32 图 2. 4 T U 划 分 结 构 Fig. 2. 4 T U partition s truc ture - 13 - 基于 HEVC 的码率控制算法 2) 帧 内 预 测 帧 内预测 是视频 编码标 准的一 项核心 技术 ,主要 是利用 已编码 的像素 值来预 测 当前像 素值。 跟 H.264 不 同的是 , HEVC 对于不同的 PU 尺寸块,其帧 内预测 模式 都 有所增 加,例如对于 16×16 的尺寸块,有 35 种预测模式; 对于 4×4 的尺寸块,有 18 种预测模式。预 测方 向的 增加可 以提高 预测的 精度, 提高压 缩的效 率,亮 度分 量 的预测 模式如 表 2.1 所示 。帧内 预测过 程大致 上分为 三步: 判断相 邻像素 的可 用 性,当参考 像素不 存在或 不可用 时 ,用距 离参考 像素最 近的像 素值来 替换 ,如 图 2.5 所 示,当 A 的参 考像素 不存在 时,B 区 域的最 下边像 素值来 代替所 有 A 区 域 的像素 值;同理 当 E 区域 的像素 值不存 在时 ,则 用 D 最右边 的像素 值进行 填充 替换。 C D E B N N A 图 2. 5 相 邻 参 考 位 置 像 素 Fig. 2. 5 Adjac ent referenc e pixels 滤 波,根 据 TU 大 小来决 定滤波 的模式 ;根据参 考像素 预测当 前 TU 的像 素值 。对 于 不 同的 区域 ,采 用不 同 的预 测模 式, 如果 当前 编 码单 元比 较平 坦, 则采 用 64 ×64 尺寸块 的预测 模式 ,如果 当前场 景复杂 ,细节 部分较 多,则采用 小的尺 寸块 预 测 模 式 , 两者结 合使用 ,可以 提高预 测精度 ,提 高编码 的效率 。 - 14 - 宁波大学硕士专业学位论文 表 2.1 亮 度 分 量 预 测 模 式 T ab. 2. 1 Luminanc e c omponen t predic tion model PU 尺寸 预测模式数 4×4 16 个预测方向、DC 模式、Planar 模式 8×8 33 个预测方向、DC 模式、Planar 模式 16×16 33 个预测方向、DC 模式、Planar 模式 32×32 33 个预测方向、DC 模式、Planar 模式 64×64 2 个预测方向、DC 模式、Planar 模式 3) 帧 间 预 测 帧 间预测 是 HEVC 的又 一项核 心技术 ,当视 频序列 中物体 变化比 较缓慢 时, 两 帧之间 的像素 值差别 不大。利用 帧的时 间相关 性进行 编码,可以获 得很高 的压 缩 比。帧间预 测过程 中,运动估 计是 一个很 重要的 环节 ,通过 运动搜 索算法 找出 最 佳匹配 块,在 HEVC 中, 提供了 全搜索 算法和 TZSearch 算 法,全 搜索算 法匹 配 每一个 编码块 ,找出 最相似 的块 作为最 佳匹配 块,虽 然可以 提高帧 间预测 的精 度 ,但 是编码 过程太 耗时 。TZSearch 算法 通过菱 形搜索 模板和 正方形 搜索模 板提 高 运动估 计的速 度,相比于 全搜索 算法 ,在 性能略 有降低 的前提 下,可以节 省将 近 80%的 时间。在实际 场景中 ,物 体的运 动并不 是像素 的整数 倍,通 过运动 搜索 找 出来的 匹配块 可能误 差较大 。为 此 ,可利 用像素 插值算 法,将运动 估计的 精度 提 高 到 亚 像 素 级别 , 亮 度 插 值滤 波 器 抽 头系 数 和 色 度插 值 滤 波 器抽 头 系 数 如表 2.2、 2.3 所 示。 表 2.2 亮 度 插 值 滤 波 器 抽 头 系 数 T ab. 2. 2 Luminanc e interpolation filter tap c oeffic ient 亚像素位置 抽头系数 1/4 {-1, 4, -10, 58, 17, -5, 1} 1/2 {-1, 4, -11, 40, 40, -11, 4, 1} 3/4 {1, -5, 17, 58, -10, 4, -1} - 15 - 基于 HEVC 的码率控制算法 表 2.3 色 度 插 值 滤 波 器 抽 头 系 数 T ab. 2. 3 Chroma interpolation filter tap c oeffic ient 亚像素位置 抽头系数 1/8 {-2, 58, 10, -2} 2/8 {-4, 54, 16, -2} 3/8 {-6, 46, 28, -4} 4/8 {-4, 36, 36, -4} 5/8 {-4, 28, 46, -6} 6/8 {-2, 16, 54, -4} 7/8 {-2, 10, 58, -2} 4) 变 换 、 量 化 和熵编 码 编 码块经 过帧内 、帧间 预测之 后,原 始值与 预测 值相减 即可得 到预测 残差。 HEVC 采 用整数 DCT 变换对 预测残 差进行 变换, 从空间 域转换 到变换 域,以 变换 系 数的形 式加以 表示, 8×8 整数 DCT 变换 矩阵如 图 2.6 所示 。适当 的变换 可以 使 得能 量在 变换 域更 为集中 ,然 后经 过量 化处理 ,可 以有 效压 缩图 像。跟 H.264 不 同的是 , HEVC 选择 变换的 块更大 ,最大 可以达到 32×32;另外 DCT 变换 矩阵 在 整数化 时放大 的倍数比 H.264 大 ,最大 倍数为 64 倍 ,所以 HEVC 的 DCT 矩阵 更 加接近 于浮 点 DCT,可以进 一步提 高编码 性能。残差信 号经 过变换 后,系 数一 般 有很大 的动态 范围 ,为了 达到更 好地 压缩效 果,对变换 系数进 行量化 ,减 少残 H8= 64 89 83 75 64 50 36 18 64 75 36 -18 -64 -89 -83 -50 64 50 -36 -89 -64 18 83 75 64 18 -83 -50 64 75 -36 -89 64 -18 -83 50 64 -75 -36 89 64 -50 -36 89 -64 -18 83 -75 64 -75 36 18 -64 89 -83 50 64 -89 83 -75 64 -50 36 -18 图 2. 6 DCT 变 换 矩 阵 Fig. 2. 6 DCT trans form matrix 差 信号的 取值范 围。 HEVC 中 变换量 化过程 如图 2.7 所 示,残 差系数 经过比 例缩 放 后再进 行量化 。量化 是指将 某个 区间的 值映射 为同一 个值的 过程,量化可 以减 - 16 - 宁波大学硕士专业学位论文 少 系数动 态范围 ,在 反量化 之后 ,不 一定与 原来的 系数相 等。量化 是 HEVC 中非 常 重要的 环节 ,由于 量化前 后系数 不一 致,所有会 导致一 定的失 真。量化器 有标 量 和矢量 两种类 型,标量量 化器因 为复 杂度低 、实 现起来 较容易 ,所 以广泛 应用 于 视频编 码标准 中,标 量量化 器的示 意图如 图 2.8 所示 ,在区 间 [t i ,t i+1 ]中 的值, 都 分 别 取 y i 作 为 输 出 值 , 通 过 量 化 , 位 于 区 间 [0,t 6 ]中 的 输 出 值 被 量 化 成 [y0 , y 1 ,y2 ,y3 ,y4 ,y5, y6 ]这七 个值,减 小系数 的动态 变化 范围。熵 编码模 块主要 将数据 编码 成 二进制 码流进 行传输 或存储 ,输入 的信息 可能 包括变 换系数 、块的 运动信 息、 帧 内、帧 间预测 模式和 块的 索引值 等。 HEVC 中 的熵编 码算法 采用基 于上下 文二 进 制算 术编 码, 其很 好地 利用了 语法 元素 值之 间的 高阶 信息, 并且考虑 了视 频流 的 统计特 性,进一 步提高 码率效 率,主要 分为三 个步骤:二 进制化、 上下文 建模 和 二 进 制 算 术编码 。 残差 变换 比例缩放 量化 系数 图 2. 7 变 换 量 化 过 程 Fig. 2. 7 T he proc es s of trans formation and quantization 输出信号y y6 y5 y4 y3 y2 y1 y0 0 t1 t2 t3 t4 t5 t6 输入信号x 图 2. 8 标 量 量 化 器 示 意 图 Fig. 2.8 Schematic diagram of scalar quantizer 5) 环 路 后 处 理 环 路 后 处 理 主 要 包 括 两 个 步 骤 , 去 方 块 滤 波 和 像 素 自 适 应 补 偿 (Sample - 17 - 基于 HEVC 的码率控制算法 Adaptive Offset,SAO)。 由于块 与块之 间的 变换量 化过程 相互独 立,每 个块的 滤波 系 数都不 相同,所 以在编 码块边 界部分 不连续; 另外,在运 动补偿 过程中, 相邻 块 的预测 块可能 来自不 同的位 置,也有可 能来自 不同的 图像,导致块 与块之 间的 像 素值不 平滑 。方块 效应严 重影响 图像 的质量 ,还 可能影 响后续 的编码 图像 。去 方 块滤波 技术可 以很好 的去除 边界效 应,一方面 可以提 高视频 的压缩 性能,另一 方 面又可 以提高 图像的 质量。去方 块滤波 技术的 具体过 程分为 三个步 骤:确 定滤 波 的边界,确保被 滤波 的边界 是 TU 或者 是 PU 的边界 ;计算 边界强 度,有的 边界 是 由于图 像本身 原因 ,导致 该区域 的纹 理度量 值很大 ,这 种情况 不需要 滤波 ;根 据 阈值决 定是强 滤波、弱滤波 还是不 滤波。SAO 可以去 除图像 边缘周 围产生 的波 纹 现象 ,SAO 以编 码单元 为基本 单位 ,利用 分类器 将像素 划分为 不同的 类别 ,对 不 同的类 别使用 不同的 补偿值。一般 可以分 为四种 边界补 偿模式,主要分 为水平 、 垂 直和对 角线方 向。如 图 2.9 所示, 其中 b 表 示当 前像素 , a 和 c 表 示与 b 相邻 的像素。 a a a b c b a b c b c c 图 2. 9 4 种 边 界 补 偿 模 式 Fig. 2. 9 4 Kinds of boundary c ompens ation model 2.2 率失真优化技术 视 频 压 缩 算 法 性 能 的好 坏 根 据 编 码重 建 之 后 的 视频 与 原 始 视 频之 间 的 失真 和 编码输 出的比 特率共 同决定 ,失 真和 比特率 相互制 约、相互限 制,失真的 增加 会 导致比 特率的 减少 ,如果 要获得 更高 的主 、客观 质量 ,则视 频的编 码产生 的比 特 率会增 加。在 HEVC 编 码平台 中,使用 率失真 优化技 术来衡 量视频 编码的 压缩 性 能, HEVC 视频编 码器在 CU 分 割、帧 内帧间 预测以 及编码 参数选 择等方 面都 利 用了率 失真优 化技术 。在允 许的失 真范围 内, 如何使 编码产 生的总 比特最 小, 或 者是在 一定的 目标比 特下,如何 使编码 后的视 频质量 最高,也就是 重建视 频与 原 始视频 之间的 失真最 小是率 失真优 化研究 的基 本问题 。在实 际编码 中,用 R 来 表 示码率 ,用 D 来表 示失真 ,率失 真函数 曲线形 式如图 2.10 所示。 从图中 可以 - 18 - 宁波大学硕士专业学位论文 看 出,率 失真函 数给出 了限定 失真条 件下信 息压 缩允许 的下界 ,当失 真为 D* 时, 函 数 R(D * )是 允 许 压缩的 最低限 度。 R(D) H(X) R(D* ) 0 D* DMAX D 图 2. 10 率 失 真 函 数 曲 线 形 式 Fig. 2. 10 The rate distortion func tion c urve form 1) 视频失真度量 失 真准确 度的测 量是衡 量编码 器性能 好坏的 重要 条件,一般来 说,视 频的失 真 度量值 应该与 人眼感 知一致 。但 是人眼 感知系 统非常 复杂,纹理复 杂的地 方可 以 隐藏较 多的失 真,纹 理平坦 的区 域失真 较大时 影响观 看效果 ,还有 运动区 域也 是 人眼关 注度比 较高的 区域 。当前 已有的 一些度 量标准 仍然与 主观感 知质量 有较 大 差 距 。常 用的 客 观失 真 度量 方法 有 绝对 误 差和 (Sum of Abso lute Difference, SAD)、平方误 差和 (Sum of Squares Error,SSE)、峰 值性 噪比 (Peak Signa l to Noise Ratio, PSNR)、 均方误 差 (Mean Square Error, MSE)等 。上述 失真度 量值的 计算 公 式 分 别 如 下所示 。 SAD M 1 N 1 | fo ( x, y) f r ( x, y) | (公式 2.1) x 0 y 0 1 SSE M N M 1 N 1 2 | f o ( x, y ) f r ( x , y ) | x 0 y 0 - 19 - (公式 2.2) 基于 HEVC 的码率控制算法 PSNR 10log10 2552 M N 2 M 1 N 1 (公式 2.3) | f o ( x, y ) f r ( x, y ) | x 0 y 0 1 MSE M N 2 M 1 N 1 | f o ( x, y ) f r ( x , y ) | (公式 2.4) x 0 y 0 公式 2.1 到 公式 2.4 中,f o (x ,y)和 f r (x ,y)分别 表示原 始像素 值和重 构像素 值, M 表 示 视频的 宽度, N 表 示视频 的高度 ,从公 式中可 以看出 ,原始 像素值 与重构 像素 值 之 间 的 差 值越大 ,则 SAD、 SSE、 MSE 越 大,PSNR 越 小。 2) 率 失 真 优 化 方法 在 HEVC 中 ,量化 、预测、编码模 式等过 程的众 多参数 中,如 何选择 最好的 编 码参数 ,使得 编码性 能最佳 是率 失真优 化需要 考虑的 问题。率失真 优化从 理论 上 给 出 了 系 统 能够 达 到 的 最 佳性 能 , 但 是确 定 序 列 的众 多 编 码 参数 复 杂 度 非常 高 ,所 以在参 数选取 过程中 ,一 般都 是将序 列划分 为众多 的子任 务,分别给 每个 子 任务确 定最优 参数集 ,则 视频序 列最优 参数集 的选择 等于最 小化所 有子任 务的 失真和。 N N i 1 i 1 min Di , s.t. Ri Rc (公式 2.5) 公 式 2.5 中 ,Di 表 示第 i 个子任 务的失 真 ,失真 度量准 则一般 用上述 提到的 SAD 、 SSE、PSNR 、 MSE 来衡量 , Rc 表示 带宽的 大小, Ri 表示第 i 个子 任务中 消耗的 比 特数。公 式 2.5 中的约 束优 化问题, 在 HEVC 中,利 用拉格 朗日优 化法转 化为 无 约 束 优 化 问题。 通过拉 格朗日 乘子 λ, 公式 2.5 转换 为: N N N i 1 i 1 i 1 min J , J Di Ri ( Di Ri ) (公式 2.6) N Ji i 1 公 式 2.6 中 ,J 表示 率失真 代价 。公 式 2.6 表明 ,对于 每个独 立的子 任务 ,每 个编 码 单元的 失真和 和码率 互不相 关,视频序 列的编 码参数 集可以 通过最 小化每 个编 码 单 元 的 率 失真代 价来确 定。亮 度分量 λ 的计 算公式 为: - 20 - 宁波大学硕士专业学位论文 mode Wk 2((QP12)/3) (公式 2.7) motion mode (公式 2.8) 公 式 2.7 中,λmode 表示 预测模 式时的 拉格朗 日因子,QP 为 量化参 数,Wk 表示 权重 因 子。公式 2.8 中 ,λmotion 表 示运动 模式时 的拉格 朗日因 子。色 度分量 λchroma 的计 算公式为: chroma mode / wchroma (公式 2.9) wchroma 2((QPQPchroma )/3) (公式 2.10) 率 失真理 论在不 考虑约 束条件 下,编码器 能够达 到的最 好性能 ,但是 实际中 的 很多制 约因素, 编码 器根本 无法达 到理论 值。 HEVC 视频编 码的任 务是找 到更 靠 近实际 率失真 曲线的 压缩方 法 。图 2.11 给出了 实际的 率失真 曲线与 理论的 率失 真 曲线关 系示意 图,中 间部分 表示 由于约 束条件 的影响 ,实际 的率失 真性能 与理 论 的 率 失 真 性能之 间的差 值。 R(D) 理论R(D) 实际R(D) D 0 图 2. 11 理 论 率 失 真 曲 线 与 实 际 率 失 真 曲 线 的 关 系 Fig. 2. 11 Relationship between theoretical rate distortion curve and actual rate distortion curve 2.3 码率控制技术 视 频图像 被编码 成码流 后,需要在 带宽 中传输 ,码 流过大 ,会 引起网 络传输 中 视频图 像的阻 塞和丢 包,码流过 小 ,就有 可能导 致存储 空间的 浪费 ,视频 质量 - 21 - 基于 HEVC 的码率控制算法 下 降严重。码率控 制通过 调整编 码参 数使得 码流跟 带宽一 致,从而 充分利 用带宽 。 码 率控制 为编码 单元分 配最优 的比特 ,使 实际产 生的码 流接近 带宽大 小,从 而保 证 视频的 质量。 相比于 R-Q 模 型,目 前最新 的码率 控制模 型是 R-λ 模 型,该 模型 在 码率控 制精度 和编码 质量上 都有较 大改善 。 在 HEVC 的 R-λ 模型中 ,码率 控制 分 为比特 分配和 参数确 定以及 更新两 个阶段 [13] 。在参 数更新 过程中 ,根据分 配给 每 一 个 基 本 单元的 比特, 确定用 于编码 的参数 。 2.3.1 比特分配 在 比 特 分 配过 程 中 ,首 先 将 目标 比 特 分配 到 每 一个 图 片 组 (Group of Picture, GOP), 再 分 配 到 每 一帧 ,最后 到基本 单元。 1) GOP 层 比 特 分 配 视 频在编 码的时 候通常 分成若 干个连 续的 GOP,是比特 分配中 的第一 层 ,GOP 层 比 特 分 配 的公式 为: TGOP Tbitleft Taverpic ( Nleft SW ) SW NGOPsize (公 式 2.11) TGOP 为 当前 GOP 分配的 目标比 特,对 于帧内 码率控 制,每一 个 GOP 分 配的码 率就 是 每 一 帧分 配的 码 率, NGOPsize=1,如 果是 低 延时 编 码结 构 ,NGOPsize=4,如 果 是随 机 接入结 构,NGOPsize=8。Tbitleft 为 编码 之后可 用的剩 余比特,Nleft 为剩 余未编 码帧数 , SW 为平滑 窗口, 一般取 40,反映 了其对 缓冲区 状态的 调整尺 度,作 用是平 滑编 码 帧的比 特输出,由公 式 2.11 可知,GOP 的分配 策略是 首先得 到平均 分配给 每一 帧 的比特 ,然后 根据编 码配置 方式决 定分 配的比 特数。Taverpic 为 每个编 码帧平 均分 配 的 比 特 , 通过公 式 2.12 计 算得到 : Taverpic Tt f (公 式 2.12) 公 式 2.12 中 , f 为 编码序 列的帧 率,T t 是 序列级 的目标 码率 ,由用 户根据 实际网 络 带 宽 的 情 况设定 。 2) 帧 层 比 特 分 配 帧 层比特 分配分 级策略 相比于 比特平 均分配 策略 ,可以 提高率 失真性 能,帧 层 比特分 配时根 据一帧 图像在 GOP 中所 占的权 重来进 行分配 ,权重 根据时 域预 测 结构而 变化 。权 重大的 图片 ,说明 重要性 比较高 ,一般是 关键帧 或者是 参考帧 。 - 22 - 宁波大学硕士专业学位论文 权 重 如 表 2.4、表 2.5 所示 : 表 2.4 低延时(Low Delay)结构时的权重 编码顺序 播放顺序 1 Tab.2.4 The weight of Low Delay structure 权重值 0.05≥bpp>0 0.1≥bpp>0.05 0.2≥bpp>0.1 bpp>0.2 1 2 2 2 2 2 2 3 3 3 3 3 3 2 2 2 2 4 4 14 12 10 6 表 2.5 随机接入(Random Access)结构时的权重 编码顺序 Tab.2.5 The weight of Random Access structure 权重值 播放顺序 0.05≥bpp>0 0.1≥bpp>0.05 0.2≥bpp>0.1 bpp>0.2 1 8 30 25 20 15 2 3 4 5 6 7 4 2 1 3 6 5 8 4 1 1 4 1 7 4 1 1 4 1 6 4 1 1 4 1 5 4 1 1 4 1 8 7 1 1 1 1 表 2.4、 表 2.5 中 bpp 表示 每比特 像素, 计算公 式为 : bpp R w h f (公 式 2.13) 公 式 2.13 中 R 表 示目标 比特, w 和 h 分别表 示图像 的宽和 高, f 为帧 率。所 以帧 层 的 比 特 分 配公式 为: Tleft TGOP CodedGOP Tslice Tleft (公 式 2.14) wslice _ cur (公式 2.15) wslice notcodedslice 公 式 2.14 和 公式 2.15,Tleft 表示 当 前 GOP 剩余的 编码比 特,TGOP 表 示 GOP 预 分配 的 比特数 ,CodedGOP 表示消 耗的比 特,wslice_cur 表 示当前 图片在 整个 GOP 中 的权重 - 23 - 基于 HEVC 的码率控制算法 值 , 由 表 2.4、表 2.5 决定 。Tslice 表示 帧层分 配的比 特。 3) LCU 层 比 特 分 配 LCU 层 的比特 分配是 指根据 当前图 像的总 比特数 ,为 所有 的 LCU 分配 比特的 过 程 , 也 是 根据权 重进行 分配。 分配公 式如下 : TLCU Tslice BitH Coded slice wLCU _ Cur wLCU (公 式 2.16) notcodedLCUs 公 式 2.16 中 , TLCU 表示当 前 LCU 分配 的比特 ,Tslice 表示 当前帧 的总 比特, BitH 表 示 估 计 的 头 比特, 是已编 码图像 头信息 所用实 际比 特的平 均值。 Codedslice 表示 已 经 编 码 消 耗 的比特 ,wLCU_Cur 表 示当前 LCU 的权 重,由 相同层 图像对 应位置 LCU 的 MAD 确 定 。 WLCU 与 MAD 的关系 为: wLCU MAD2 (公 式 2.17) MAD 的 计 算 公 式为 : MAD 1 N pixels | pred porg | (公 式 2.18) Npixels 表示 当前 LCU 里的像 素个数,Porg 表示原 始信号 的像素 值,Pred 表 示预测 信号 的像素值。 2.3.2 参数确定以及更新阶段 通 过比特 分配过 程,得到 编码块 的预分 配比特 之后,需 要确 定当前 块的 QP , 才 能进行 编码。首先需 要确定 用于编 码的 λ 值,再通 过 λ 与 QP 的关系 确定 QP 值 , 用 于 编 码 。 λ 与比特 的关系 为: λ α bpp β (公 式 2.19) bpp 表 示平均 分配给 每一个 像素的 比特,α 和 β 是 两个 模型参 数,通过 编码很 多图 片 , 然 后 数 据拟合 得出, 初始值 为 3.2003、 -1.367。 QP 与 λ 之 间的关 系为: QP 4.2005 ln λ 13.7122 (公 式 2.20) - 24 - 宁波大学硕士专业学位论文 计 算得到 的 QP 就可 用于编 码,为了适 应序列 的变化 ,α 和 β 会 根据序 列的内 容 自适应 更新 。设 αold 和 βold 分别表示 之前编 码单元 的 α 和 β 值,αnew 和 βnew 分 别表 示 更 新 之 后 的 α 和 β 值 ,λactual 为实 际编码 的编码 参数, bppactual 表示 上一帧 相同位 置 CU 编 码 消 耗的 实际比 特, 则更新 过程可 以表示 为: αnew = αold + δα (lnλactual - lnλcompute ) αold (公式 2.21) βnew βold δβ (ln λactual ln λcompute ) ln bppactual (公 式 2.22) 其 中 , δα 和 δβ 根 据不同 的 bpp 选取 不同的 值,λcompute 采 用下式 计算: βold λcompute αold bppactual (公 式 2.23) 在 更新过 程中,λ 和 QP 值的 变化可 能较大 ,编码 视频的 质量会 因为码 率分配 的 不 平 衡 出 现过大 波动, 所以在 图片和 基本单 元级 别,把 λ 和 QP 限 制在 一定范 围 内 。 图 片 级别的 限定策 略为: 2 2 λlpic _ avg 2 3 λcpic _ est λlpic _ avg 2 3 (公 式 2.24) QPlpic _ avg 2 QPcpic _ est QPlpic _ avg 2 (公 式 2.25) 公 式 2.24、 公式 2.25 中, λlpic_avg、 QPlpic_avg 分别 表示相 同层已 编码图 像的平 均 λ 和 QP 值, λcpic_est、 QPcpic_est 分 别表示 当前图 像估计 的 λ 和 QP 值。 在基本 单元级 别中, λ 和 QP 的 限 定 策略为 : 1 1 λlbu 2 3 λcbu _ est λlbu 2 3 (公 式 2.26) QPlbu 1 QPcbu _ est QPlbu 1 (公 式 2.27) 公 式 2.26、公 式 2.27 中 ,λlbu 、QPlbu 分别 已编码 单元 的 λ 和 QP 值,λcbu_est、QPcbu_est 分 别 表 示 当 前编码 单元估 计的 λ 和 QP 值 。 2.4 本章小结 本 章首先 介绍 了 HEVC 的编 码框 架和关 键技术, 包括 帧内、帧 间、量 化、熵 编 码等核 心技术。接着介 绍了率 失真优 化技术,最后阐 述了 HEVC 码率控 制技术 , 包 括 比 特 分 配和参 数更新 两部分 。 - 25 - 基于 HEVC 的码率控制算法 3 基于复杂度分析的 HEVC 帧内码率控制算法 HEVC 码 率 控制算 法在码 率输出 的精度 和效率 上都取 得不错 的效果。 通过三 层 的比特 分配 ,码率 更加接 近于给 定的 带宽大 小。但是在 视频序 列中 ,不同 的图 像 复杂度 差别较 大,尤 其是发 生场 景变换 时候,图像之 间分配 的比特 应该随 着图 像 的复杂 度变化 而变化,这是 HEVC 码 率控制 算法所 没有考 虑到的,即没有 考虑 视 频编码 内容的 复杂度。针对此 问题,本 章提出 了一种 基于复 杂度 的 HEVC 帧内 码 率控制 算法,可以进 一步提 高码 率控制 的精度 和视频 质量。首先根 据复杂 度来 合 理分配 码率,然后根 据实际 比特 和预分 配比特 自适应 地更新 平滑窗 口,最 后结 合 基本单 元层的 码率控 制算法 及时调 节码率 ,从 而使输 出码率 尽可能 与目标 码率 相 等。实验结 果表明 ,本 章所提 出的 方法能 够使输 出码率 更加接 近目标 码率 ,并 且 可 以 进 一 步提高 视频质 量。 3.1 复杂度分析及算法优化 图 像 内 容 的 复杂度 有多种 衡量方 法,文 献[65]认 为梯 度计算 方法比 较简单 , 也 能较准 确表现 图像内 容的复 杂程度 ,适 合描述 静止图 像的复 杂度。并且人 们倾 向 于用边 缘来描 述纹理 复杂度 ,而边 缘地区 的相 邻亮度 像素值 通常相 差比较 大, 所 以用梯 度来衡 量复杂 度比较 合适 。因此 本章采 用梯度 来描述 图像的 复杂度 。梯 度 的 计 算 公 式为: H 1 W 1 Ck (| Ii, j Ii1, j | | Ii, j Ii, j 1 |) (公式 3.1) i 1 j 1 H W 公 式 3.1 中,H、W 分别表 示当前 帧的高 和宽。Ii,j 表示编 码帧点 (i,j)位 置的亮 度分 量 像 素 值 。 Ck 为第 k 帧的复 杂度。 为 了进一 步验证 梯度跟 编码比 特之间 是否存 在线 性关系 ,在量 化参数 分别为 22、 27、32、37 的情况 下编码 了复杂 度互不 相同的 测试序 列,每个 序列编 码 100 帧 。 本 章 利 用 R2 来 衡量线 性拟合 的程度 。R2 定义 为: R 2 2 i ( X i X i e ) 1 i ( X i X i m )2 (公式 3.2) - 26 - 宁波大学硕士专业学位论文 公 式 3.2 中,X i 和 Xi-e 分别表 示在 i 点上的 实际值 和通 过线性 拟合出 的估计 值,Xi-m 表 示所有 点的均 值, R2 越接近 1, 说明拟 合程度 越好, 线性关 系越强 ,模型 就越 准确。 (a) BlowingBubbles (c) RaceHorsesC QP=27 QP=27 (b) BlowingBubbles QP=32 (d) RaceHorsesC QP=32 图 3.1 复杂度与码率的关系 Fig. 3. 1 Relations hip betw een c omplexity and bit rate 图 3.1 是上述 实验的 结果。 描述 了 RaceHorsesC、 BlowingBubbles 序 列 的复杂 度 和码率 的关系 ,横坐 标表示 复杂度 ,纵坐 标表 示码率 ,x 表示线性 拟合之 后的 复 杂度的 大小,y 为拟合 之后复 杂度 为 x 产生 的码 率。序列 在 QP 为 27 和 32 的情 况 下进行 编码。 通过线 性拟合 ,可以 在 图 3.1 中 看到 , R2 都约 等 于 1,线性 拟合 - 27 - 基于 HEVC 的码率控制算法 程 度比较 好。所 以编码 比特跟 图像 梯度之 间存在 近似的 线性关 系,并 且复杂 度越 大 ,编码 的比特 就越多 。从 3.1a 和 3.1b 这两个 图中, 可以看 出对于 同一序 列用 不 同的 QP 进行 编码时 ,码 率跟梯 度的线 性关系 依然存 在,只 是斜率 略有变 化。 当 QP=27 时 ,斜率 为 0.0715, 当 QP=32 时,斜 率为 0.0381。从 3.1a 和 3.1c 这两 个 图中可 以看到,即使是 不同序 列,复 杂度跟 编码比 特依然 有非常 好的线 性关系 。 因 此,本 章在比 特分配 过程中 采用 图像的 梯度进 行指导 。对梯 度越大 即纹理 越复 杂 的帧,将会被 分配更 多的比 特进 行编码 以保证 编码质 量,而 对梯度 较小即 纹理 简 单的帧 。只 需要分 配较少 的比特 。这种策 略使得 比特分 配更加 合理 ,减少 了比 特 的 浪 费 。 综上分 析,公 式 2.12 改 进为: Taverpic CcurrG Tt M CtotalG f (公式 3.3) M CtotalG Ck (公 式 3.4) k 1 公 式 3.3 中, CcurrG 表示 当前帧 的图像 复杂度 ,由公 式 3.1 得到 。CtotalG 表示编码帧 总 的 复 杂 度 ,通过 公式 3.4 计算 得到, M 表示要 编码的 帧数。 HEVC 码 率控制 的过程 是根据 预分配 的比特 利用 R-λ 模型 计算相 应的量 化参数 以 及拉格 朗日乘 子。量 化参 数以及 拉格朗 日乘子 在一定 程度上 影响编 码过程 中的 模 式选取 等过程 ,这 些过程 间接地 影响 实际的 编码比 特。由于上 述原因 ,实 际产 生 的比特 和预分 配的比 特会存 在一些 偏差 。为了 使实际 的编码 比特更 加地接 近预 分 配的比 特,本 章利用 平滑窗 口对 比特分 配进行 调节。其基本 策略是 根据前 一帧 的 码 率 情 况 反馈调 节当前 帧的码 率。因 此,最 终的 比特分 配策略 为: TGOP Tbitleft Taverpic ( Nleft ASWcurr ) ASWcurr NGOPsize (公式 3.5) 公式 3.5 中 , ASWcurr 为 自适应 平滑窗 口,在 窗口更 新策 略中会 进一步 介绍。 3.2 窗口更新策略 在 比特分 配策略 中,平 滑窗口 对比 特分配 具有较 大的影 响,窗 口的大 小直接 影 响每一 帧的预 分配比 特。 在 R-λ 码率控 制模型 中,平 滑窗口 是固定 值,这 种策 略 不能根 据实际 编码情 况进行 实时地 反馈调 节。另外,相邻两 帧之间 梯度变 化不 - 28 - 宁波大学硕士专业学位论文 大 ,可以 根据上 一帧的 梯度来 预测 当前帧 的梯度 ,然后 利用梯 度跟码 率的线 性关 系 得到码 率。当前一 帧预先 分配较 多的 比特 ,而实 际消耗 比特较 少时 ,说明 预分 配 比特过 多,下一帧 需要适 当减少 预先 分配的 比特 。根据 以上分 析,本章定 义自 适 应平滑 窗口 ASW,使 得 ASW 自适 应地随 着上一 帧实际 产生的 码率和 预分配 码率 差 变化,如 果前一 帧预分 配码率 多,实际 产生的 码率少, ASW 就会根 据码率 差自 适 应变大 ,从 而使当 前帧分 配的码 率减 少。如果前 一帧预 分配码 率少 ,实际 产生 的 码率多 ,ASW 就 会根据 码率差 自适应 变小, 从而增 加当 前帧分 配的码 率。ASW 大 小 的 计 算 的公式 为: ASWcurr ASW f -1 Test Tact ASW f 1 (公式 3.6) 公 式 3.6 中,T est 表 示前一 帧预先 估计的 码率, Tact 表示 前一帧 实际产 生的码 率, ASWf-1 表示 前一帧 的更新 窗口。 由公 式 3.6 可以看 到当 Test 大 于 Tact 时 ,当前 帧的 ASW 自 适应变 大,从 而使得 当前帧 预分配 的码率 减少 ,当 Test 小 于 Tact 时,当 前帧 的 ASW 自适 应变小 ,从 而使得 当前预 分配的 码率增 加。考虑到 如果上 一帧的 码率 偏 差很大 ,相 应 ASW 会变 化很大 ,反向 影响当 前帧的 码率分 配, 根据实 验测试 , 把 ASW 限定 在 [32,48]范围内 比较 合适 ,如 果超 过这 个范 围, 就自 动把 这一 帧的 ASW 设 为 40。 3.3 实验结果及其分析 为 了客观 准确地 验证算 法有效 性,所 有的实 验都 是在 HM11.0 平台下 进行, 实 验中所 有序列 都采用全 I 帧进 行编 码,编 码帧数为 100 帧。 为了验 证算法 具有 普 适性,实验在 同一目 标码率 下,采 用 4:2:0 格 式 的不同 分辨率 序列:RaceHorses、 BQMall 、 BasketballPass 、 BQSquare 、 RaceHorsesC 、 BlowingBubbles 、 BasketballDrill 、 PartyScene、Johnny 进 行 测试 ,其 中 BQMall、PartyScene 纹 理较 复杂, BasketballPass、 BQSquare 纹 理 比 较平 坦。最 后将本 算法与 Li 的 算 法 [13]对 比。 为 了 进 一 步 比较本 章所提 的码率 控制算 法与 Li 算 法 的 性能, 定义 Rdev 如下 所示: Rdev | Rtarget Ractual | Rtarget 100% (公式 3.7) - 29 - 基于 HEVC 的码率控制算法 公 式 3.7 中,Rtarget 为目标 码率,Ractual 为 实际产 生的码 率。Rdev 表示目标比特与实际产 生比特之间的误差百分比,越小 表示码 率偏差 越小 ,实际 产生的 码率更 加接近 目标 码 率。定 义 GPSNR 为本 章算法 相比 于 Li 算 法 PSNR 的变 化情况, “+” 表示本 章算 法 高 于 Li 的 算 法 。 GPSNR ProPSNR LiPSNR (公式 3.8) 公式 3.8 中,ProPSNR 表示 利用本 章算法 得到的 序列 的 PSNR,LiPSNR 表示利 用 Li 算 法 得 到 的 序 列 的 PSNR。 表 3.1 码率比较 序列 RaceHorses BasketballPass BQSquare BlowingBubbles RaceHorseC BasketballDrill BQMall Tab.3.1 Rate comparison Li Li-码率 目标码率(kbps) -R dev(‰) (kbps) Pro-码率(kbps) Pro -R dev(‰) 900 900.086 0.096 900.026 0.029 1200 1200.043 0.036 1200.082 0.068 1500 1500.144 0.096 1500.122 0.081 900 900.032 0.036 899.936 0.071 1200 1199.960 0.033 1199.840 0.133 1500 1499.964 0.024 1499.960 0.027 900 900.034 0.038 900.110 0.122 1200 1199.837 0.136 1200.072 0.060 1500 1500.134 0.089 1500.077 0.051 900 900.016 0.018 900.068 0.076 1200 1199.972 0.023 1199.912 0.073 1500 1500.068 0.045 1499.928 0.048 900 900.010 0.011 899.954 0.051 1200 1200.002 0.002 1200.001 0.001 1500 1499.832 0.112 1499.976 0.016 900 900.052 0.058 900.000 0.000 1200 1200.104 0.087 1200.016 0.013 1500 1500.120 0.080 1500.200 0.133 900 900.005 0.006 899.962 0.042 - 30 - 宁波大学硕士专业学位论文 PartyScene Johnny 1200 1200.048 0.040 1200.048 0.040 1500 1500.038 0.025 1500.053 0.035 900 900.040 0.044 900.036 0.040 1200 1200.064 0.053 1200.028 0.023 1500 1499.944 0.037 1500.028 0.019 900 900.154 0.171 900.067 0.074 1200 1200.125 0.104 1199.866 0.112 1500 1500.250 0.167 1500.192 0.128 1200.040 0.062 1200.021 0.058 Average 表 3.2 PSNR 比较 序列 RaceHorses BasketballPass BQSquare BlowingBubbles RaceHorseC BasketballDrill BQMall Tab.3.2 PSNR comparison 目标码率 LiPSNR (dB) ProPSNR (dB) (kbps) GPSNR (dB) 900 31.20 31.32 +0.12 1200 32.57 32.67 +0.10 1500 33.71 33.82 +0.11 900 33.16 33.27 +0.11 1200 34.63 34.75 +0.12 1500 35.81 35.92 +0.11 900 22.40 22.48 +0.08 1200 23.55 23.65 +0.10 1500 24.55 24.67 +0.12 900 27.98 28.09 +0.11 1200 29.05 29.16 +0.11 1500 29.96 30.06 +0.10 900 27.17 27.23 +0.06 1200 27.90 27.98 +0.08 1500 28.55 28.62 +0.07 900 27.49 27.57 +0.08 1200 28.45 28.52 +0.07 1500 29.31 29.40 +0.09 900 24.91 24.97 +0.06 - 31 - 基于 HEVC 的码率控制算法 PartyScene Johnny Average 1200 25.74 25.81 +0.07 1500 26.44 26.51 +0.07 900 21.64 21.67 +0.03 1200 22.11 22.14 +0.03 1500 22.51 22.56 +0.05 900 30.40 30.48 +0.08 1200 31.61 31.68 +0.07 1500 32.58 32.67 +0.09 28.35 28.43 +0.08 表 3.1、表 3.2 分别给 出了测 试序 列 Racehorses、Johnny、BQMall、BasketballPass、 BQSquare、RaceHorsesC、BlowingBubbles、BasketballDrill、PartyScene 在 各 个 码率 下, Li 算 法 与 本章算 法的 PSNR 增 益和输 出码率 情况 。从 表 3.1、表 3.2 的 实验结 果可 知 ,本章 算法能 更好地 根据图 像的 复杂度 来分配 每一帧 的码率 ,本章 实际输 出码 率 更加接 近目标 码率, 码率偏 差相比于 Li 算 法 更小, 而且 PSNR 有 所增加 。如 BQSquare 序 列在 1500kbps 时 PSNR 增加 0.12dB,实际产 生的码 率更加 接近目 标码 率 , BasketballDrill 序 列 在 900kbps 时 PSNR 增 加 0.08 dB,且码 率正好 等于目 标码 率 。Racehorses 序列 在 900kbps 时 PSNR 增加 0.12 dB,码率偏 差比 Li 的 更 低。总的 来 说,本章 算法 的 PSNR 在 Li 的 基础 上平均 增加 0.08 dB,码 率偏差 更小。这 是因 为 ,一 方面在 帧层码 率分配 的时候 ,考虑了 图像的 复杂度 ,复 杂度高 的帧分 配更 多 的码率 ,使 得码率 分配更 加合理 。另一 方面是 利 用 ASW 实现了 码率 反馈,当前 一 帧码率 预分配 过少,而 实际消 耗过多 时,ASW 根据 码率差 自适应 调节,使 得当 前 帧预 分配 的码率 跟实 际消 耗的码 率差 距减 小,从 而提 高序 列的 PSNR。但 是比 如 PartyScene,PSNR 只提高 了 0.05 dB,提升 不是很 明显, BQMall 的 PSNR 相 对来 说 提高也 有限。原 因在于 ,这两 个序列 的纹理 复杂度 较高,ASW 的 变化大, 一旦 超 过 ASW 的 限 定范围 ,ASW 就自 动回归 到原始 值 40,所以 PSNR 提 升有 限。 - 32 - 宁波大学硕士专业学位论文 表 3.3 BDBR 性能比较 Tab.3.3 BDBR performance comparison 序列 BDBR(%) BasketballPass -2.2% BQSquare -2.3% BlowingBubbles -2.9% RaceHorses -2.7% BasketballDrill -2.3% BQMall -2.2% PartyScene -2.1% RaceHorseC -2.4% Johnny -1.8% Average -2.3% 表 3.3 给 出了测 试序 列 RaceHorses、Johnny、BQMall、BasketballPass、BQSquare、 RaceHorsesC、BlowingBubbles、BasketballDrill、PartyScene 相 比 于 Li 算 法 的 BDBR 性 能 变 化情况 ,“- ”表示 本章算 法优于 Li 算 法 。从 表 3.3 的结 果可知 ,对 于相同 的 PSNR, 本 章算法 的率失 真性能 在 Li 的 基 础上有 所提高,如 RaceHorseC 序列率 失真性 能增 加 了 2.4%,BQSquare 序列 率失 真性能 相比于 Li的 算法 增加了 2.3%, BlowingBubbles 序 列率失 真性能 增加 了 2.9%,其余 序列的 率失真 性能也 有所增 加 。总的 来说 ,对 于 相同 的 PSNR,各 个序列 的率失 真性能 在 Li 的 基础 上平均 增加 2.3%。这 是因为 , 一 方面利 用复杂 度来分 配码率 ,充 分提高 码率的 利用效 率,另一方 面在 ASW 自适 应 变化过 程中,每一帧 分配的 码率 跟实际 需要的 码率偏 差更小 ,可以 更好的 利用 码 率 , 提 高 率失真 性能。 图 3.2 是 Blowingbubbles 序 列 和 BQSquare 序 列 的 率 失 真 性能 曲线图 ,横坐 标 表 示 编 码 产生的 比特, 纵坐标 表示 PSNR, 正方 形表示 本章所 提算法 ,菱形 为 Li 所 提 算 法 。 由 图 3.2 可知 ,本章 所提算 法对 Blowingbubbles 序 列 和 BQSquare 序 列 的 率 失 真性能 比 Li 的 算 法 要 好,其 他序列 的率失 真性能 也有所 提高。 图 3.3 给 出了不 同分辨 率序 列 BasketballPass、BQMall 在 本 算 法与平 台算法 下的 码 率波动 性比较 ,横坐 标表示 编码的 帧数, 纵坐 标表示 编码每 一帧产 生的比 特。 从 图 3.3 中可 以看出 序列 BasketballPass、BQMall 的 码 率相 比 于 Li 的 算 法,在 提高 PSNR 的前提 下,整 体码率 波动 性更好 。本算 法相比于 Li 的 算 法在 BasketballPass - 33 - 基于 HEVC 的码率控制算法 序 列的 前 30 帧码 率波动 明显减 小,后 续帧的 波动 性也比 较小, BQMall 除 了 第 31 帧 外,码 率波动 性都 比 Li 的 更好,本章算 法在增 加视频 客观质 量的同 时,进 一步 稳 定了视 频的比 特波动 性。主 要是 因为本 章算法 考虑了 帧层的 复杂度 ,根据 复杂 (a) Blowingbubbles (b) BQSquare 图 3.2 本章算法与 Li 算法的率失真性能比较 Fig.3.2 Comparison of RDO between proposed algorithm and Li algorithm 度 分配比 特,然 后 ASW 根 据预分 配比特 和实际 比特的 差值自 适应变 化,进 一步 平 滑码率 误差。跟 Li 算 法 相比, 实际产 生的码 率与分 配码率 之间的 偏差更 小, 码 率 分 配 更 加准确 ,从而 提高码 率的利 用效率 ,进 一步改 善编码 性能。 (a) BasketballPass (b) BQMall 图 3.3 本章算法与 Li 算法的码率波动性比较 Fig.3.3 Comparison of rate volatility between proposed algorithm and Li algorithm - 34 - 宁波大学硕士专业学位论文 3.4 本章小结 本 章根据 视频内 容的复 杂度自 适应分 配目标 比特 ,分别 从帧层 和参数 更新模 块 进行了 优化 。在帧 层,利用梯 度作 为每一 帧的复 杂度来 自适应 分配比 特,复杂 度 高的帧 分配更 多的比 特,从而改 善视 频的质 量。另外 ,提出 了一个 自适应 参数 更 新的方 法,通 过前一 帧的 预分配 比特和 实际产 生比特 的差值 来更新 当前帧 的平 滑 窗口。实验结 果表明 ,本方 法编码 后的视 频质 量 Li 的 要好,实际产 生的码 率比 Li 的 算 法 更 加 接 近 目 标码率 。 - 35 - 基于 HEVC 的码率控制算法 4 基于特征保护的 HEVC 码率控制算法 现 有的码 率控制 算法在 压缩性 能和编 码效率 上都 取得不 错的效 果,码 率控制 通 过多级 的比特 分配策 略,把 比特 分配到 具体的 编码单 元,再 通过相 应的模 型计 算 出编 码单 元的 QP, 使编 码产 生的 码流 接近 于目 标比特 。通 过码 率控 制技 术, 在 带宽一 定的限 制下 ,可以 提高视 频的 质量 ,满足 人们的 视觉需 求。但是在 一些 新 兴应用 中,比如智 能视频 监控 、视 频拼接 等。经过压 缩传输 后的视 频是计 算机 对 其 进 行 处 理 ,而 计 算 机 一 般都 是 通 过 提取 特 征 对 视频 中 的 物 体进 行 研 究 和探 索 。所以 当最终 压缩的 视频信 息接 收者是 计算机 时,码 率控制 的比特 分配过 程就 需 要致力 于保护 视频中 的重要 特征 ,对特 征区域 分配更 多的比 特,保 护更多 的特 征 点,计 算机视 觉算法 处理相 应的压 缩视频 时可 以取得 更好的 性能, 但是 HEVC 中 的码率 控制算 法并没 有考虑 这种情 况。为了有 效解决 此问题 ,本章 在码率 分配 过 程中考 虑了图 像的特 征,根 据图像 的特征 掩膜分 配比特。根据特 征点 把 LCU 块 分 成不同 级别, 根据编 码单元 的优先 级分配 比特 。根据 最后对 结果的 分析可 知, 本 章所提 算法对 不同的 视频序 列都有 不错的 效果 ,在不 增加复 杂度的 情况下 ,提 高 了 视 频 特 征点的 保护数 量。 4.1 特征掩膜的提取 SIFT 算 法由 David Lowe 在 1999 年提 出并发 表, 于 2004 年正 式对其 进行完 善 总结 [66]。 SIFT 算法 对于 目标 的平移 、旋 转以 及很多 非正 常情 况都能 保持 良好 的 匹配性 能,应 用领域 非常广 泛,所 以本文 利用 SIFT 算法提 取特征 点,根 据特 征 分 布 情 况 提取特 征掩膜 ,便于 后续处 理。 4.1.1 特征点提取分析 利 用 SIFT 算法 提取特 征点 ,首先 需要对 图像下 采样, 得到分 辨率不 同的图 像 金字塔 ,金 字塔中 的每一 层图像 与标 准差不 同的高 斯函数 卷积 ,得到 一组 ( octave) 模 糊 程度 不同 的图像 。设均 值为 u, 标准差 为 δ 的 高斯 函数为 : G ( x) 1 2 2 e ( x u ) 2 2 2 (公式 4.1) 标 准差 δ 越大 ,卷 积图像 越模糊 。序 列 BasketballPass 第 一帧 与标准 差分别 为 2、 4、 6 的 高 斯 函数 卷积效 果如图 4.1 所 示。 - 36 - 宁波大学硕士专业学位论文 (b) δ=2 时的卷积图像 (a) 原始图像 (c) δ=4 时的卷积图像 (d) δ=6 时的卷积图像 图 4.1 BasketballPass 第一帧与高斯函数卷积效果 Fig.4.1 BasketballPass 1st frame and Gauss function convolution effect 然 后对同 一组中 相邻的 图片进 行相减 ,得 到高斯 差分图 像组。最后比 较当前 像 素点与 同一组 相邻两 层图片 对应像 素点的 3×3 领 域内共 26 个像素 点的大 小, 初 步确定 极值点 。极值 比较如 图 4.2 所示 ,其中 红色点 表示当 前像素 值,黑 色点 表 示 3×3 邻 域 的像 素值。 Scale 图 4.2 极值检测 Fig.4.2 Extreme point detection - 37 - 基于 HEVC 的码率控制算法 上 述方法 检测的 极值点 容易受 噪声的 干扰 ,为了 获得稳 定的特 征点,需要进 一 步对高 斯差分 函数进 行曲线 拟合或 者剔除 不稳 定的边 缘响应 点等操 作,即 可确 定 特 征 点 的 位置。 在 实际应 用中,视频的 分辨率 越大 ,相应 的用来 表示视 频的特 征点数 量就越 多, 并且特 征点的 重要程 度各不 相同,一 般来说, 响应越 大,重要 性越强, 反之 亦然。 (a) BasketballPass (b) PartyScene 图 4.3 序列特征点的响应情况 Fig.4.3 Response of sequence feature points 图 4.3 表示 BasketballPass 序 列 前 100 个特征 点 和 PartyScene 序列 前 300 个特 征 点的响 应。其中横 坐标表 示特征 点个 数,纵坐标 表示对 应特征 点的响 应,在本 文 算法中 优先选 取响应 强的特 征点进 行保护 。特 征点数 量过多 ,会造 成特征 分布 过 于广泛 ,重 要性降 低,太少又 不足 以表示 图像的 信息 ,所以 本文根 据序列 分辨 率 不 同 选 取 不同特 征点进 行处理 ,特征 选取情 况如 表 4.1 所示。 表 4.1 特征点选取情况 Tab. 4.1 Feature points selection 分辨率 416×240 832×480 1920×1080 特征点 100 个 300 个 1000 个 序列 BasketballPass100 个 特征点和 PartyScene300 个特 征点在 原始图 中的分 布 情 况 如 图 4.4 所 示,图 中白色 圆中心 表示特 征像 素点的 位置。 - 38 - 宁波大学硕士专业学位论文 (a) BasketballPass (b) PartyScene 图 4.4 序列第七帧特征点分布情况 Fig. 4.4 Distribution of feature points in the sequence of seventh frames 4.1.2 特征掩膜分析 由 上述方 法得到 的特征 点,经过统 计发现 每一 组(octave)的特征 点分布 情况如 图 4.5 所 示。特 征点分 布在 第一组 中的比 例较高 ,所以 第一组 上的特 征点所 在区 域 需要重 点保护 。特 征区域 掩膜的 提取 ,可 以根据 特征点 在 LCU 中的分 布情况 , 把 每 一 个 LCU 划 分 为不同 等级, 等级越 高,说 明包 含的特 征点保 护级别 越高。 (a) BasketballPass (b) PartyScene 图 4.5 特征点在每一组中的分布情况 Fig. 4.5 distribution of feature points in each octave - 39 - 基于 HEVC 的码率控制算法 (a) BasketballPass 原始图 (b) BasketballPass 分块掩膜图 (c) Cactus 原始图 (d) Cactus 分块掩膜图 图 4.6 原始图与掩膜图比较 Fig.4.6 comparison between original and mask BasketballPass 序 列和 Cactus 序 列的特 征掩膜 图如 图 4.6 所示 。图 4.6b 和图 4.6d 中,每 个区域 都是以 LCU 尺 寸大小 为单位 进行划 分。其 中,白 色的区 域表 示 含有第 一组 (octave)特 征点 的 LCU 集 合,浅 灰色的 区域表 示含有 第二组 (octave) 特 征点 的 LCU 集 合,深 灰色的 区域表 示含有 第三 组 (octave)特征点 的 LCU 集合, 黑 色块表 示不含 特征点 的 LCU 集 合。在 比特分 配时, 根据区 域包含 特征点 的级 别 不同,分 配不同 的比 特。如果 一个块 包含不 同 octave 的 特征点 ,将 octave 小的 索 引 作 为 当 前块的 索引值 。 4.2 HEVC 码率控制算法的修正 由 HEVC 基 本单 元层比 特分配 公式 2.16 可知, 比特分 配算法 只是根 据当前 LCU 在 整个 图片中 所占的 权重来 分配比 特,并没有 考虑图 片特征 因素 。在一 些新 兴 应用中 ,特征 保护相 对整体 质量 来说显 得更加 重要,所以本 文在基 本单元 层比 特 分 配 时 考 虑 特征 的 分 布 情 况, 根 据 图 像的 特 征 分 布来 分 配 每 个基 本 单 元 的比 特, 保护特 征区域。 由 4.1.2 小节可 知,根据 特征掩 膜图,把 图片中 的 LCU 分成 了 多种不 同的等 级, LCU 等级越 高, 需要分 配更多 的比特 给当 前 LCU,以 保护 - 40 - 宁波大学硕士专业学位论文 块 内的特 征点 。LCU 等 级越低 ,则在 满足基 本主观 质量的 情况 下,分 配较少 的比 特 。 比 特 分 配公式 为: Tleft Tpic BitHeader Coded pic wLCU _ Cur TLCU Tpic wLCU (公式 4.2) L (公式 4.3) notcodedLCUs 公 式 4.2 中,Tleft 表 示编码 当前 LCU 后剩 余的 比特,Tp ic 表 示当前 帧分配 的比特 , Bit Head e r 表示 头信息 比特,Codedpic 表示 已经编 码消耗 的比特 。L 表示 当前 LCU 块 的 权 重 , 根 据不同 的优先 级,L 的 取值如 表 4.2 所示。 表 4.2 L 权重值 Tab. 4.2 L weight value octave 1 2 3 4 L a b c d 如 果 当 前 LCU 中 没 有包含 特征点 ,则按 照 HEVC 基 本 单元的 原始比 特分配 算 法 分 配 相 应的比 特。如 果当前 LCU 中 包含 octave 为 1 的 特征 点,则 L=a,权 重 最大,分 配的比 特最 多,通过 实验数 据拟合 可知, 在 a=3、 b=1.5、 c=1.5、 d=1 时 匹 配 效 果 最佳。 4.3 实验结果分析 4.3.1 实验配置 为 了 客 观 准 确地验 证算法 有效性 ,所有 的实验 都是 在 HM15.0 平 台下进 行, 实 验 中 所 有 序列都 采用全 I 帧 编码, 编码帧 数为 150 帧 。采用 4:2:0 格 式 的不 同 分 辨率序 列:BasketballPass、PartyScene、BasketballDrill、BasketballDrive、Cactus、ParkScene、 Kimono1 进 行 测 试 。 4.3.2 结果及分析 本 章旨在 于保护 视频特 征点数 量,视频经 过传输 后,如 果特征 点跟原 始视频 特 征 数 量 匹 配越多 ,则说 明本文 算法性 能更好 ,所 以本章 用 MS 来衡量 码率控 制 性 能 的 好 坏 。MS 的计算 公式定 义为: - 41 - 基于 HEVC 的码率控制算法 MS N ip ×100% Noi (公 式 4.4) 其 中 Nip表 示第 i 帧已经 保护 的特征 点个数 ,压缩 视频的 特征点 经过比 率测试 、对 称 测试 后,选 出高质 量、 鲁棒性 较强的 匹配 点作为 原始 视频的 特征匹 配点 。Nio表 示 第 i 帧未经 压缩 时的特 征点个 数,对于 分辨率 为 416×240 的 序列,未经压 缩时 的 特征点 Nio个 数为 100,对于 分辨 率为 832×480 的序 列,未 经压缩 时的特 征点 Nio个 数 为 300,对于分 辨率 为 1920×1080 的序列 ,未 经压缩 时的特 征点 Nio个数 为 1000。MS 越 大,说明 保护的 特征点 越多,算 法性能 越好。测 试结果 如表 4.3 所示 : 表 4.3 匹配率比较 Tab.4.3 Comparison of matching rate org △MS(%) pro sequence bitrate(kbps) MS(%) bitrate(kbps) MS(%) 5029.26 86.49 5028.70 87.81 +1.32 2945.32 79.94 2945.41 81.59 +1.65 1647.93 69.94 1647.95 71.26 +1.32 901.32 56.73 901.31 57.83 +1.10 47787.88 89.16 47787.87 90.04 +0.89 30061.30 83.56 30060.86 84.16 +0.60 18055.61 75.09 18055.43 75.93 +0.84 9929.46 62.70 9929.50 64.23 +1.53 20555.15 85.93 20554.99 87.46 +1.53 11156.37 78.58 11156.32 80.30 +1.72 5990.83 68.56 5990.90 69.93 +1.37 3310.64 54.76 3311.03 55.80 +1.04 62351.17 85.91 62351.29 87.00 +1.09 26109.53 78.28 26109.60 79.32 +1.05 13714.05 66.91 13714.11 68.70 +1.79 7669.85 52.40 7669.67 54.10 +1.71 107508.46 87.21 107508.77 88.30 +1.09 BasketballPass PartyScene BasketballDrill BasketballDrive Cactus - 42 - 宁波大学硕士专业学位论文 49906.65 80.05 49907.26 81.03 +0.98 27075.97 69.85 27075.21 70.84 +0.98 14651.16 55.24 14651.58 56.62 +1.38 52789.76 85.46 52789.86 86.29 +0.83 28636.71 77.70 28636.79 78.68 +0.98 14899.06 65.76 14898.99 67.02 +1.26 7347.46 47.31 7347.45 48.98 +1.68 18697.94 83.30 16898.48 83.89 +0.59 10609.08 74.87 10609.39 75.87 +1.00 6290.85 61.87 6290.96 63.57 +1.70 3701.83 43.48 3701.82 45.88 +2.41 21697.55 71.68 21697.55 72.95 +1.27 ParkScene Kimono1 Average 表 4.3 给 出了测 试序 列 BasketballPass、PartyScene、BasketballDrill、BasketballDrive、 Cactus、ParkScene 和 Kimono1 特 征 匹配性 能比较 情况,其 中 org 表示原 始的码 率控 制 算法, pro 表示 本章提 出的码 率控制 算法, MS 表 示匹配 率,通 过公式 4.4 计算 得 到。△MS 表 示匹配 增益 ,由 本章算 法的匹 配率与 原始算 法匹配 率相减 得到 , “+” 表 示本算 法优于 原始算 法。由 表 4.3 可知 ,本章 算法的 匹配率 相比于 原始算 法有 所 提高 ,比如 Kimono1 的 低码率 时原始 算法匹 配率为 43.48%,本章算 法为 45.88%, 增 加了 2.41%,其码 率也在 可控范 围内 。BasketballPass 在 高码率 时原始 算法匹 配率 为 86.49%,本章算 法为 87.81%,提高 了 1.32%。BasketballDrill 在 低 码 率时原 始算 法 匹配率为 78.58%,本 章算法 为 80.30%, 提高了 1.72%。跟 原始的 码率控 制算 法 相比, 本章提 出的算 法整体 提高匹 配性 能 1.27%,这 是因为 在码率 分配时 ,对 特 征 LCU 块进 行保护 ,尽 可能保 留块内 的细节 和特征 区域, 多分配 比特提 高编 码 块的质 量,所 以在特 征匹配 时,可 以提高 匹配 效率。 从表 4.3 中还 可以看 出, 对 于同一 序列,编 码的目 标比特 不同,匹 配率不 同。总体上 来说,序 列在不 同码 率 下进行 编码时, 目标比 特越小, 匹配增 益越大,因 为在目 标比特 充足时, 视频 的 特征区 域和非 特征区 域都有 很好的 质量 ,所以 提升空 间有限 ,但是 随着目 标码 率 的减少 ,视 频的总 体质量 变差 ,通 过本文 的特征 保护算 法,可以优 先给特 征区 域 分配较 多的比 特,从而 充分保 障特 征区域 的质量,对于非 特征区 域进行 粗量化 , 可 以 更 好 地 提高视 频的匹 配率。 - 43 - 基于 HEVC 的码率控制算法 表 4.4 算法时间复杂度比较 Tab.4.4 Algorithm time complexity comparison 序列 BasketballPass BasketballDrill BasketballDrive 时间(org) 100% 100% 100% 时间(pro) 104% 106% 106% 从 时间复 杂度角 度来分 析,本 章选取 低分辨 率序 列 BasketballPass、BasketballDrill 和 高分辨 序列 BasketballDrive 作 为测 试对象 。由 表 4.4 可知 ,时 间复杂 度都在 可控 范 围内, 因为本 章利用 SIFT 算 法提取 特征点 ,根 据特征 点将 LCU 块 分类两 个过 程 ,都 可以看 成是编 码之前 进行的 预处 理操作 ,并 不会占 用编码 时间 。后续 掩膜 读 取过程 和基本 单元层 比特分 配过程 ,产 生的复 杂度都 在可接 受范围 内,其 他所 有 序 列 的 情 况类似 。 (a) BasketballPass (b) BasketballDrive 图 4.7 PSNR 波动性比较 Fig.4.7 Comparison of PSNR volatility 图 4.7 是 BasketballPass 序 列和 BasketballDrive 序 列 的客观 质量波 动图, 横坐标 表 示编码 帧数,纵坐标 表示 PSNR。由图 4.7 可知 ,本章 提出的 码率控 制算法 在质 量 波动性 方面与 原始码 率控制 算法相 当,视频客 观质量 不会出 现较大 的变化 ,视 屏 质 量 的 波 动也在 一定范 围内。 图 4.8 是 BasketballDrill 序 列 第 一帧 在相同 目标比 特下的 效果图 ,左图 为原始 平 台算法 编码结 果,右图是 本章的 算法 编码结 果。从图中 可以看 出,两帧图 像主 观 质量相 差不大 ,篮球 区域和 19 号球员 区域的 质量比 原始的 编码效 果更好 ,本 章 算法避 免了特 征块分 配比特 过多 ,其他 块比特 过少而 产生的 块效应 ,从而 造成 - 44 - 宁波大学硕士专业学位论文 视 频质量 下降。总的来 说,本章所 提算法 并没有 对视频 的主观 质量造 成很大 的影 响 , 在 兼 顾 主观质 量的情 况下, 提升了 特征的 匹配 效率。 (a) 原始编码效果 (b) 本章编码效果 图 4.8 BasketballDrill 第一帧效果图 Fig.4.8 1st frame of BasketballDrill between the original and proposed 4.4 本章小结 针 对当前 的 HEVC 码率 控制算 法没有 考虑视 频特征 的保护 问题 ,本章 提出了 基 于特征 保护的 帧内码 率控制 算法 ,对标 准码率 控制算 法进行 了改进 ,提高 了特 征 点的保 护数量 。根据 特征掩 膜把基 本单元 块分 成不同 的等级 ,根据 LCU 所在 等 级分配 不同的 比特。从 最后的 结果 分析可 知,本算 法不会 影响视 频的观 看质量 , 也 不会显 著降低 客观质 量。本算 法针 对 HEVC 帧内码 率控制 算法做 出了改 进,在 未 来 的 工 作 中,会 考虑利 用时域 信息来 指导比 特分 配,进 一步提 高匹配 率。 - 45 - 基于 HEVC 的码率控制算法 5 总结与展望 5.1 本文工作小结 随 着超高 清显示 技术的 发展 ,视频 数据的 爆炸式 增长, HEVC 视频编 码技术 由 于其优 秀的压 缩性能 ,将会 成为 视频应 用中的 主流编 码技术 。如何 根据带 宽大 小 来 合 理 分 配 资源 , 是 码 率 控制 中 的 一 个重 要 研 究 问题 。 基 于 此背 景 , 本 文从 HEVC 码 率控制 角度进 行研究 ,通过 研究帧 层的 比特分 配算法 ,发现 ,码率 控制 算 法在码 率控制 的精确 度和率 失真性 能方面 还可 以进一 步提高 ,据此 对帧层 的码 率 控制算 法进行 了改进 。针 对具体 的应 用,码率控 制性能 还有所 欠缺 ,据此 对码 率 控 制 算 法 进行了 改进。 本毕业 论文的 主要工 作总 结如下 : 1) HEVC 码 率控制 算法采 用三层 比特分 配策略 ,逐层 分配比 特,根 据 R-λ 模 型 计算得 到量化 参数 ,充分 利用比 特资 源。但是在 研究中 发现 ,帧层 比特分 配策 略 并没有 考虑视 频帧本 身的纹 理复杂 度。为了提 高视频 编码的 性能,本文提 出了 复 杂度分 析的 HEVC 码率控 制算 法,考虑 视频帧 的纹理 复杂度 ,重新 分配帧 层的 比 特。通 过定义 纹理复 杂度因 子,纹 理复杂 的帧 在比特 分配时 所占的 权重更 大。 在 实验中 发现,平滑窗 口对视 频的 质量也 有一定 的影响 ,具体 提出了 平滑窗 口自 适 应更新 的方法 ,即通 过前一 帧的 预分配 比特和 实际产 生比特 的差值 来更新 。实 验 结果表 明所提 算法 与 Li 的算法相比,提 出的算 法改善 了率失 真性能 ,对于 相同 的 PSNR,各 个序列 的平均 可以节 省 2.3%的 码率 ,最高 可以节 省 2.9%的 码率 。在 目 标码率 相同的 情况下 ,提 高了视 频的质 量, PSNR 最 高可以 增加 0.12dB,平均 增 加大 约 0.08dB, 相比 于 Li 的 码率 控制算 法,所提 方法的 比特控 制精确 度更高 , 码 率 分 配 更 加准确 ,从而 提高码 率的利 用效率 。 2) 在 计算机 视觉发 展大潮 中 ,很多 压缩视 频的后 续处理 是计算 机相关 算法对 其 进 行 探 索 和 研究 。 码 率 控 制的 比 特 分 配过 程 需 要 致力 于 保 护 视频 中 的 重 要特 征 ,对 特征区 域进行 保护 ,分配 更多 的比特 ,在 后续的 计算机 视觉相 关算法 进行 处 理时, 可以取 得跟原 始序列 相近的 性能。 但是 HEVC 中的码 率控制 算法并 没有 考 虑这种 情况。为 了有效 解决此 问题,本 文提出 了基于 特征保 护的 HEVC 码 率控 制 算法, 通过 SIFT 提取 特征点 ,根据 特征点 在 LCU 中 的位置 ,提取 特征掩 膜, 并 对其进 行分级 标记处 理 ,对重 要的 LCU 块 分配更 多的比 特 ,保块 内的特 征数量 , 对 不含特 征点 的 LCU 块, 在保持 视频质 量基本 稳定的 前提下 ,减少 比特的 分配。 最 后的 实验 结果表 明相 比于 原始 平台算 法 HM15.0,所 提算 法可 以提高 视频 的匹 配 率,最 高可以 增加 2.41%, 平均 可以增 加 1.27%。算 法的时 间复杂 度也在 可接 - 46 - 宁波大学硕士专业学位论文 受 范围内 ,视 频质量 波动性 跟原始 平台 相差无 几,没有损 失视频 的客观 质量 ,从 主 观的角 度看,也没有 出现某 些块 分配码 率过多 ,剩余 块分配 码率过 少而出 现的 块 效 应 , 所 提算法 在兼顾 主观质 量的情 况下, 提升 了特征 的匹配 效率。 5.2 未来研究展望 码 率控制 算法在 带宽受 限的情 况下传 输视频 数据 ,在保 证视频 的整体 质量方 面 具有非 常重大 的意义 。本文 对 HEVC 码 率控制 算法做 了一些 改进措 施,但 是对 其 发展贡 献有限 ,有 待于进 一步的 工作 。结 合本论 文的研 究内容 ,未 来的研 究可 以 从 几 个 方 向入手 : 1) 结 合视觉 因素的 码率控 制模型 。如何利 用人眼 视觉的 掩蔽效 应提高 压缩效 率 ,更 好的去 除视觉 冗余 ,改善 编码 性能是 一大研 究热点 ,可 通过考 虑更加 贴近 人 眼的视 觉因子 ,比 如 JND 或 者其他 视觉感 知因子 等对编 码比 特的影 响。建 立视 觉 因素与 比特的 模型,根据视 觉注 意模型 来分配 比特,使得编 码压缩 后的质 量更 加 符合人 的视觉 需求。当前虽 然有 很多的 码率控 制算法 对这方 面展开 研究,但是 人 眼视觉 不仅仅 是关注 一些运 动物体 和脸部 区域 ,有时 候人们 也会主 观选择 一些 物 体进行 关注 ,如交 通监控 系统 ,人 们就会 对车辆 和行人 感兴趣 。利 用人眼 视觉 在 特定场 景下的 注意机 制,如何将 特殊情 况下的 人眼视 觉注意 机制应 用到码 率控 制 比 特 分 配 中是需 要重点 研究和 探索的 问题。 2) 随 着计算 机视觉 技术的 大力发 展,视 频的智 能化处 理越来 越普及,如何提 高 压缩视 频与原 始视频 的匹配 率,在计 算机视 觉处理 中很重 要。同样带 宽下 ,特 征 保护的 越多 ,算法 在处理 压缩视 频时 ,与 处理原 始视频 时的效 果越接 近。在本 论 文的特 征保护 码率控 制算法 中,特征掩 膜需要 预先提 取,此 方法增 加了在 实际 应 用中的 复杂度 ,如何 利用 时空相 关性甚 至频域 相关性 来预测 当前帧 的特征 区域 进 行 编 码 也 是可以 进一步 研究的 方向。 3) 码 率控 制算法 在整体 的比特 控制精 度上取 得了 很好的 效果,但 是每一 帧预 分 配比特 与实际 消耗比 特之间 的误差 还有很 大的 提升空 间,可 以利用 深度学 习和 机 器学习 对比特 分配进 行改进 ,利 用图像 的特征 进行训 练,提 高模型 参数的 准确 性 ,再根 据训练 好的模 型分配 每一帧 或者每 一个 LCU 的比特 ,提高 比特的 利用 效 率 和 比 特 控制精 度。 - 47 - 基于 HEVC 的码率控制算法 参考文献 [1] Chernock R, Whittaker J C. Next-generation broadcast television: ATSC 3.0 [Standards in a Nutshell], IEEE Signal Processing Magazine, 2016, 33(1):158-162. [2] VCEG I. Joint Call for proposals on video compression technology [C]. VCEGAM91 and MPEG N, 2010, 11113: 2010. [3] Sullivan G J, Ohm J R, Han W J, et al. Overview of the High Efficiency Video Coding (HEVC) standard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012, 22(12):1649-1668. [4] Sanz-Rodriguez S, Schierl T. A rate control algorithm for HEVC with hierarchical GOP structures. 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, 2013:1719-1723. [5] Liang X, Wang Q, Zhou Y, et al. A novel R-Q model based rate control scheme in HEVC. 2013 Visual Communications and Image Processing (VCIP), Kuching, 2013: 1-6. [6] Xu M, Deng X, Li S, et al. Region-of-interest based conversational HEVC coding with Hierarchical perception model of face[J]. IEEE Journal of Selected Topics in Signal Processing, 2014, 8(3):475-489. [7] Luo J, Ahmad I, Sun Y. Controlling the bit rate of multi-object videos with non-cooperative game theory[J]. IEEE Transactions on Multimedia, 2010, 12(2):97-107. [8] Tan Y H, Yeo C, Li Z. Single-pass rate control with texture and non-texture rate-distortion models[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012, 22(8): 1236-1245. [9] Liu M, Guo Y, Li H, et al. Low-complexity rate control based on ρ-domain model for Scalable Video Coding[C]. 2010 IEEE International Conference on Image Processing, Hong Kong, 2010:1277-1280. [10] Zhang F, Steinbach E. Improved ρ-domain rate control with accurate header size estimation[C]. 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Prague, 2011:813-816. [11] Wang S, Ma S, Wang S, et al. Quadratic ρ-domain based rate control algorithm for HEVC[C]. 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, 2013: 1695-1699. [12] He Z, Wu D O. Linear rate control and optimum statistical multiplexing for H.264 Video Broadcast[J]. IEEE Transactions on Multimedia, 2008, 10(7): 1237-1249. [13] Li B, Li H Q, Li L, et al. Lambda domain rate control algorithm for High Efficiency Video Coding[J]. IEEE Transactions on Image Processing, 2014, 23(9): 3841-3854. [14] Xie J F, Song L, Xie R, et al. Temporal dependent bit allocation scheme for rate control in HEVC[C]. 2015 IEEE Workshop on Signal Processing Systems (SiPS), Hangzhou, 2015:1-6. [15] Li S L, Xu M, Wang Z L. A novel method on optimal bit allocation at LCU level for rate control in HEVC[C]. 2015 IEEE International Conference on Multimedia and Expo (ICME), Turin, 2015: 1-6. [16] Zhao H L, Xie W, Zhang Y C, et al. An SSIM-motivated LCU-level rate control algorithm for HEVC[C]. 2013 Picture Coding Symposium (PCS), San Jose, CA, 2013: 85-88. [17] Tang T Y and Liu Z. Rate control based on content complexity in video coding[J]. Journal of Electronics & Information Technology, 2006, 28(6): 1115 -1119. [18] Cui Z G and Zhu X C . Image complexity adaptive intra-frame rate control algorithm for H.264/AVC [J].Journal of Electronics & Information Technology, 2010, 32(11): 2547-2553. [19] Tian L, Zhou Y M, Cao X J, et al. A new rate-complexity-QP algorithm (RCQA) for High Efficiency Video Coding intra-picture rate control[C]. 2014 International Conference on Computing, Networking and - 48 - 宁波大学硕士专业学位论文 Communications (ICNC), 2014:375-380. [20] Gao W, Kwong S, Zhou Y, et al. SSIM-based game theory approach for rate-distortion optimized intra frame CTU-level bit allocation[J]. IEEE Transactions on Multimedia, 2016, 18(6): 988-999. [21] Sanchez V, Auli l F, Vanam R, et al. Rate control for lossless region of interest coding in High Efficiency Video Coding intra coding with applications to digital pathology images [C]. Acoustics, Speech and Signal Processing (ICASSP), 2015 IEEE International Conference on. IEEE, 2015:1250-1254. [22] Wang M H, Ngan K N, Li H L. An efficient frame-content based intra frame rate control for High Efficiency Video Coding[J]. IEEE Signal Processing Letters, 2015, 22(7): 896-900. [23] Tu Q, Guo X Q, Men A D, et al. A frame-level HEVC rate control algorithm for videos with complex scene over wireless network[C]. 2014 IEEE 79th Vehicular Technology Conference (VTC Spring), Seoul, 2014:1-5. [24] Li W, Yang F Z, Ren P. H.265/HEVC frame-level bitrate allocation algorithm considering video content [J]. Journal on Communications, 2015, 134(5):1167-1174. [25] Lu Q, Cen F, Xu W. Efficient rate control for intra-only coding in high efficiency video coding[C]. 2013 Ninth International Conference on Natural Computation (ICNC), Shenyang, 2013: 1329-1333. [26] Sun H, Zhang C, Gao S. LCU-level bit allocation for rate control in High Efficiency Video Coding[C]. 2014 IEEE China Summit & International Conference on Signal and Information Processing (ChinaSIP), Xi'an, 2014: 354-358. [27] Hou Y, Ye Y, Lei J J, et al. Rate control for HEVC based on spatio-temporal context and motion complexity [J]. Multimedia Tools & Applications, 2016:1-19. [28] Zheng Q Y, Yu M, Peng Z J, et al. Human visual system-based rate control algorithm for H.264/AVC[J]. Journal of Optoelectronics Laser, 2011, 22(3):440-445. [29] Sun H, Gao S, Zhang C. Adaptive bit allocation scheme for rate control in high efficiency video coding with initial quantization parameter determination[J]. Signal Processing Image Communication, 2014, 29(10):1029-1045. [30] Marwa M, Marco C, Beatrice P P, et al. ROI-based rate control using tiles for an HEVC encoded video stream over a lossy network, Image Processing (ICIP)[C]. 2015 IEEE International Conference on, Quebec City, QC, 2015: 1389-1393. [31] Wang M H and Ngan K N. Optimal bit allocation in HEVC for real-time video communications[C]. Image Processing (ICIP), 2015 IEEE International Conference on, Quebec City, QC, 2015: 2665-2669. [32] Liu Y, Li Z G, Soh Y C. Region-of-interest based resource allocation for conversational Video communication of H.264/AVC[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008.18(1): 134-139, [33] 孙乐, 戴明, 陈晓露,等. 基于人眼视觉系统的 H.264/AVC 码率控制算法[J]. 光学精密工程, 2014, 22(4):1020-1028. [34] Wu C Y, Su P C, Yeh C H, et al. A joint content adaptive rate-quantization model and region of interest intra coding of H.264/AVC[C]. 2014 IEEE International Conference on Multimedia and Expo (ICME), Chengdu, 2014:1-6. [35] Deng X, Xu M, Wang Z. A ROI-based bit allocation scheme for HEVC towards perceptual conversational video coding[C]. 2013 Sixth International Conference on Advanced Computational Intelligence (ICACI), Hangzhou, 2013:206-211. [36] Chiang J C, Hsieh C S, Chang G, et al. Region-of-interest based rate control scheme with flexible quality on demand[C]. 2010 IEEE International Conference on Multimedia and Expo, Suntec City, 2010:238-242. - 49 - 基于 HEVC 的码率控制算法 [37] Wang P, Zhang Y, Hu H M, et al. Region-classification-based rate control for flicker suppression of I-frames in HEVC[C].2013 IEEE International Conference on Image Processing, Melbourne, VIC, 2013: 1986-1990. [38] Lee B, Kim M, Nguyen T Q. A frame-level rate control scheme based on texture and non-texture rate models for High Efficiency Video Coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2014, 24(3): 465-479. [39] Li S, Xu M, Deng X, et al. Weight-based R- λ, rate control for perceptual HEVC coding on conversational videos [J]. Signal Processing Image Communication, 2015, 38(C):127-140. [40] Wang S, Ma S, Wang S, et al. Rate-GOP based rate control for High Efficiency Video Coding[J]. IEEE Journal of Selected Topics in Signal Processing, 2013, 7(6): 1101-1111. [41] Liu M, Ren P, Xiang Z. Frame-level bit allocation for hierarchical coding of H.265/HEVC considering dependent rate-distortion characteristics[J]. Signal Image & Video Processing, 2016, 10(8):1457-1463. [42] Zupancic I, Naccari M, Mrak M, et al. Studying rate control methods for UHDTV delivery using HEVC[C].2016 International Symposium ELMAR, Zadar, 2016: 47-50. [43] Zhou M, Zhang Y, Li B, et al. Complexity-based intra frame rate control by jointing inter-frame correlation for high efficiency video coding [J]. Journal of Visual Communication & Image Representation, 2017, 42:46-64. [44] Yan B, Sun K. Joint complexity estimation of I-frame and P-frame for H.264/AVC rate control[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2012, 22(5): 790-798. [45] Zhang Z W, Jing T, Han J N.A new rate control scheme for video coding based on region of interest, in IEEE Access , 2017:1-1. [46] Hamidouche W, Raulet M, Deforges O. 4K Real-time and parallel software video decoder for multilayer HEVC extensions[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(1): 169-180. [47] Biatek T, Hamidouche W, Travers J F, et al. Adaptive rate control algorithm for SHVC: Application to HD/UHD[C]. 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Shanghai, 2016: 1382-1386. [48] Li L, Li H Q. λ Domain based optimal bit allocation for scalable high efficiency video coding[C]. 2015 IEEE International Symposium on Circuits and Systems (ISCAS), Lisbon, 2015:2788-2791. [49] Yang S H, Vo P B. Adaptive bit allocation for consistent video quality in scalable High Efficiency Video Coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016:1-1. [50] Boyce J M, Ye Y, Chen J, et al. Overview of SHVC: scalable extensions of the High efficiency video coding standard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(1): 20-34. [51] Li L, Li B, Liu D, et al. λ-Domain rate control algorithm for HEVC scalable extension[J]. IEEE Transactions on Multimedia, 2016, 18(10): 2023-2039. [52] Wang M H, Ngan K N, Li H. Low-delay rate control for consistent quality using distortion based lagrange multiplier[J]. IEEE Transactions on Image Processing, 2016, 25(7): 2943-2955. [53] Hou J, Wan S, Ma Z, et al. Consistent video quality control in scalable video coding using dependent distortion quantization model[J] IEEE Transactions on Broadcasting, 2013,59(4): 717-724. [54] Xu L, Li S, Ngan K N, et al. Consistent visual quality control in video coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2013, 23(6): 975-989. [55] Li S X, Xu M, Wang Z L, et al. Optimal bit allocation for CTU level rate control in HEVC[J]. IEEE - 50 - 宁波大学硕士专业学位论文 Transactions on Circuits and Systems for Video Technology, 2016:1-1. [56] Fiengo A, Chierchia G, Cagnazzo M, et al. Rate allocation in predictive video coding using a convex optimization framework[J]. IEEE Transactions on Image Processing, 2017, 26(1): 479-489. [57] Chen Q, Wu D. Delay-rate-distortion model for real-time video communication[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2015, 25(8): 1376-1394. [58] Chao J, Huitl R, Steinbach E, et al. A novel rate control framework for SIFT/SURF feature preservation in H.264/AVC video compression[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2015, 25(6): 958-972. [59] Yoon Y J, Kim H, Jung S H, et al. A new rate control method for hierarchical video coding in HEVC[M]. IEEE international Symposium on Broadband Multimedia Systems and Broadcasting, Seoul, 2012: 1-4. [60] Zeng H, Ngan K N, Wang M. Perceptual adaptive lagrange multiplier for high efficiency video coding[C].2013 Picture Coding Symposium (PCS), San Jose, CA, 2013: 69-72. [61] GAO W, Kwong S, and Yuan H, et al. DCT coefficient distribution modeling and quality dependency analysis based frame-level bit allocation for HEVC[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2016, 26(1): 139-153. [62] Wang X, Kwong S, Zhang Y, et al. Applying game theory to rate control optimization for Hierarchical B-pictures[J]. IEEE Transactions on Broadcasting, 2013, 59(4): 591-601. [63] Hachicha W, Kaaniche M, Beghdadi A, et al. Efficient inter-view bit allocation methods for stereo image coding[J]. IEEE Transactions on Multimedia, 2015, 17(6): 765-777. [64] Schwarz H, Marpe D, Wiegand T. Overview of the scalable video coding extension of the H.264/AVC Standard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2007, 17(9): 1103-1120. [65] Jing X, Chau L P, Siu W C. Frame complexity-based rate-quantization model for H.264/AVC Intra frame Rate Control[J]. IEEE Signal Processing Letters, 2008, 15:373-376. [66] Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Joural of Computer Vision, 2004, 60(2):91-110. - 51 - 基于 HEVC 的码率控制算法 在 学 研 究 成 果 1、 作 为 研 究人 员参加 的项目 /课 题 [1] 国 家 自 然 科 学基金 资助项 目(No.61620106012) [2] 浙 江 省 自 然 科学基 金资助 项目( No.LY16F010002, No.LY17F010005) [3] 宁 波 市 自 然 科学基 金资助 项目(No.2015A610127, No.2015A610124) 2、 在 学 期 间所 获奖励 [1] 2015-2016 年 宁波大 学学业 奖学金 二等奖 [2] 2016-2017 年 宁波大 学学业 奖学金 二等奖 [3] 第 十 二 届 全 国研究 生数学 建模竞 赛三等 奖 3、 在 学 期 间发 表的论 文 [1] 基 于 复 杂 度 分析的 HEVC 帧内 码率 控制算 法[J]. 计 算 机 应 用与 软 件 ,2017,(01):143-148.(第 一作 者) 4、 参 与 的 科研 项目 [1] An adaptive bit mismatch rectification algorithm for intra frame rate control in HEVC, 2015 8th International Congress on Image and Signal Processing (CISP), Shenyang, 2015:80-84. (第 三 作 者) - 52 -