Uploaded by Creamy One

一种基于5G网络的MEC协作传输VR视频架构方案v0.1

advertisement
专利申请技术交底书
初拟的发明名称
一种基于 5G 网络的 MEC 协作传输 VR 视频架构方案
技术领域
本发明涉及 VR 视频传输领域,确切地说是一种基于 5G 网络的 MEC 协作传输
VR 视频架构方案。
背景技术
5G 即第五代移动通信技术 (The 5h Generation Wireless Communication),是继
2G、3G 和 4G 系统之后的延伸,其设计目标是高数据速率、低传输延迟、提升传输
质量、节省能源、降低成本、提高系统容量和大规模设备连接。
2015 年发布的 ITU-R M. 2083-0 建议书定义了 5G 的三大应用场景:增强移动
宽带(Enhanced Mobi le Broadband,eMBB)、超可靠低时延通信(Ultra Reliable and
Low Latency Communication, uRLLC) 和 海 量 机 器 类 通 信 ( Massive Machine Type
Communication,mMTC)。增强移动宽带(eMBB)是以人为中心的应用场景,集中
表现为超高的传输数据速率,广覆盖下的移动性保证 。超可靠超低时延通信(uRLLC)
以无人驾驶、 远程医疗 、智能制造等 关键通信 为应用场景, 必须严格 满足业务需求
的时延和可靠性。4G 网络时延最小只能达到 20ms 左右,但是 5G 系统本身可将端
到端时延降低到 1~10ms。海量机器类 通信( mMTC)以大规模物联网为应用场景,
支持密集环境 下的海量 机器类通信, 使得人与 机器、机器与 机器的大 规模通信成为
可能。5G 结合其三大应用场景,与智慧家庭、智慧城市等社会生活领域结合,与超
高清视频和 VR/AR 等多媒体应用、车联网和工业互联网等行业融合,渗透到生产和
生活的各领域,为经济与社会发展注入强劲动力。
与 4G 时期相比,5G 网络服务具备更贴近用户需求、定制化能力进一步提 升,
网络与业务深 度融合以 及服务更友好 等特征, 其中代表性的 网络服务 能力包括 :网
络切片、移动边缘计算(Mobile Edge Computing,MEC)、按需重构的移动网络、以
用户为中心的无线接入网和网络能力开放。
4G 时代下的网络服务普遍采用云端协同方式,即远端的云计算或者云数据中心
和终端相互配合完成网络服务的提供和访问。在 5G 时代下,大量高可靠低时延业务
出现,对网络传输和服务计算的时延效率提出更高需求,使得 MEC 的应用需求更为
广泛。
1
MEC 改变 4G 系统中网络与业务分离的状态,将业务平台下沉到网络边缘,就
近向用户提供服务,实现网络从接入管道向信息化服务使能平台的关键跨越。 MEC
作为 5G 网络新型网络架构的主要特征之一,部署在无线基站、接入机房等网络边
缘,为边缘侧 开放计算 、存储和处理 等功能, 实现资源的弹 性利用 , 降低核心网的
负载开销。具 有发挥移 动云计算海量 连接和高 吞吐量优势, 能克服终 端 用户与云端
数据中心物理距离过长所带来的传输时延问题。MEC 是进一步提升移动网络性能、
适应新兴业务场景需求的关键技术。
虚拟现实(Virtual Reality,VR)通过动态环境建模、实时三维图形生成、立体
显示观看、实 时交互等 技术,生成仿 真现实的 三维模拟环境 ,能够构 造视觉、听觉
等方面高度主 观真实的 人体感官感受 。用户借 助交互设备与 虚拟场景 中的对象相互
作用、相互影响、沉浸其中,获得等同亲临客观真实环境的感受和体验。VR 视频是
指全景视频,如水平 360°×垂直 360°全景视频、水平 180°×垂直 180°全景视
频等,用户可借助 VR 眼镜等虚拟现实设备观看全景视频,并获得身临其 境的视觉
感受。目前的 VR 视频的类型主要是 3DoF。3DoF 是指用户可以在任何方向(偏转、
俯仰和滚动) 自由地观 看节目素材 , 典型的应 用场景是坐在 椅子上的 用户通过 头戴
式显示器(Head Mounted Display,HMD)观看 VR 视频内容。
观看 VR 视频的典型流程。观看 VR 视频时,用户需佩戴 VR 眼镜(配合手机使
用)或一体式的 HMD,运行在用户手机或机顶盒等设备上的 VR 视频应用软件启动
并初始化 VR 眼镜或 HMD 中的陀螺仪等传感器装置,用户通过遥控器、手柄等输入
设备与 VR 视频应用软件进行实时交互。当用户头部发生运动时, VR 眼镜或 HMD
中的陀螺仪等传感器装置实时检测头部的运动状态,并将参数传递给 VR 视频应用
软件的处理模块。处理模块获取到用户头部的运动状态参数后,VR 视频应用软件立
即计算用户的观看视角并重新渲染新的一帧图像传递至 VR 眼镜或 HMD 上,用户
可以进行实时观看。
VR 视频端到端系统流程。首先是使用全景摄像机拍摄,随后将多路视频拼接融
合为完整的 360°全景视频,即 VR 视频源文件。360°全景视频经过映射和高效的
视频压缩后再传输,最终分发到 VR 终端设备。VR 终端设备对 VR 视频进行解码、
渲染和显示。
VR 视频映射是 VR 视频编码的预处理环节,通常将 360°全景视频图像映射成
为二维平面视频图像,再送入编码器进行编码传输。 VR 视频有多种映射表示方式,
从压缩编码的角度看,不同的映射方式其压缩效率也不同。运动图像专家组(Moving
Picture Experts Group,MPEG)等标准中提出了多种映射模型,最常用的是 等距圆柱
映射(Equi-Rectangular Projection,ERP)和正六面体映射模型。映射后的 VR 视频
可采用普通视频的编码技术进行压缩。目前应用较多的视频编码技术是 H.264、H.265
和 AVS2 等。码率是影响 VR 视频在终端接收观看清晰度的重要指标。现在阶段 4K
VR 视频需要 20~40Mbps 的码率、8K VR 视频需要 80~120Mbps 的码率,强交互模
2
式下运动感知时延应小于 10ms,弱交互模式下运动感知时延应小于 20ms。
VR 视频传输主要有两种技术路线:基于全视角和基于视场角(Field of View,
FOV)的传输方案。
全 视角 传输 方案就 是将 整 个 360°环绕 画面 都传 输给 终端 ,当用 户头部 转动 需
要切换画面时,所有的处理都在终端本地完成。VR 视频在相同单眼可视分辨率情况
下,由于帧率、量化电平、360°环绕等原因,码率要比普通平面视频大很多,前者
一般是后者的 5~10 倍,这对于传输来说是个极大的挑战,成本也大大增加。
然 而用户在 观看视频 时, 有一定的 视角限制 , 不 会观看到 全部内容 , 因 此,全
视角传输方案对带宽会有较大浪费。
FOV 传输方案主要传输当前视角中的可见画面。一般都是将 360°全景视野划
分为若干个视 角,每个 视角生成一个 视频文件 ,只包含视角 内高分辨 率和周围部分
低分辨率视觉 信息,终 端根据用户当 前视角姿 态位置,向服 务器请求 对应的视角文
件。具体地,如 TWS(Tile Wise Streaming,基于分块的自适应传输)方案,服务器
端将 VR 视频划分为多个 tile,每个 tile 分别编码,根据终端请求的视角信息,选择
视角区域的高质量 tile,并准备一个低质量的 VR 全视角视频码流,然后 响应给用户
终端。
VR 视频基于全视角和 FOV 的传输方案可应用于 5G 网络、有限电视网络、IPTV
和互联网等传输网络中。其中,基于 FOV 的 VR 视频传输方案要求传输网络具有双
向通信能力。
5G 网络可以随时随地提供 100Mbps 以上大带宽,满足 4K VR、8K VR 视频对
分辨率的要求,同时 5G 网络的 5~8 毫秒级的网络时延将消除 VR 视频观看的眩晕
感。因此 5G 网络是 VR 视频传输的优选方案。
发明内容
VR 视频传输需要一个大带宽、低时延、高能效的网络,为此,我们发明一种 5G
网络下的 MEC 协作传输架构来满足 VR 视频传输性能需求并提升终端用户体验。
本发明是采用如下技术方案实现的:
整个传输架构由中心云、5G 网络、MEC 协作域和用户终端四个部分组成。下面
介绍四个组件的功能。
中心云:当 VR 视频业务部分合成计算能力下沉到网络边缘后,中心云主要负
责 VR 视频的前期制作与分发,包括视频拼接缝合、VR 视频映射和编码、以及将编
码内容分发到 MEC 上。将拼接缝合好的 360°2D 视频图像采用 ERP 方式投影到二
维平面,然后将二维图像划分成若干个 tile 块。用户的视场角 FOV,即目光聚集的
画面区域由多个 tile 块构成。由于用户在一个时刻只注意 FOV 内的画面,对 FOV 周
围的画面并不是特别关注,因此,我们对构成 FOV 的多个 tile 块采用高码率传输,
3
对构成 FOV 周围的画面的多个 tile 块采用低码率传输,为了简单起见,采用传输整
个低码率的全景图像来充当用户当前 FOV 的周围背景图像。此外,用户的 FOV 并
不固定,每一个 tile 块所在的画面区域都有可能成为用户的 FOV。于是,对每个 tile
块我们都准备 一个高码 率版本和一个 低码率版 本。 因为传输 整个低码 率全景图像的
时延和传输构成一个 FOV 的高码率 tiles 块的时延相差无几,于是中心云只向 MEC
协作域分发一 个低码率 的全景图像 便 足以支持 整个协作域对 此的请求 ,而高码率的
tiles 块依据每个 MEC 对其请求的热度而分发。
5G 网络:5G 网络对于 VR 视频系统,可以提供更大的下行带宽,在下行传输当
前 VR 视频观看视点时,可以同时打包下发周边多个视点的视频内容 。基于 5G 网络
的 VR 视频传输网络从结构上可以划分为三个部分,前传网络、回传网络以及核心
网络。前传网络由众多无线接入节点 连接基站(Base Station,BS)构成,用于解决
最后一英里问题。通常一个基站负责一片小区域(如几个住宅区和商业区),这个区
域内的用户在 使用移动 上网时都将与 该基站建 立连接。在我 们的发明 中此 基站也被
称为这些用户的 home BS。回传网络由众多基站连接移动交换节点构成,通过该交
换节点,可以接入到 5G 核心网,并进一步连接到其他网络 ,如互联网。前传网络和
回传网络共同构成了 5G 网络中的无线接入网(Radio Access Network,RAN)。通常
为了获得较好的性能以及服务更多的用户,大型数据中心(也称云节点),一般配置
有海量的存储空间以及计算资源,且部署在骨干网络的核心交换节点附近 ,如 5G 核
心网与互联网的交接处。
MEC 协作域:在传统的 RAN 网络中,当用户要点播一个视频时,数据将跨越
多个网络,包括 前传网 络,回传网络, 核心网 ,互联网等。此 模式的 不足在于: 1)
用户将等待较长时间且对时延敏感的应用不友好;2)无线接入网特别是其中的回传
网络将面临较大流量压力。一种解决方案是在基站附近部署 MEC 服务器,通过在网
络的边缘提供 计算以及 存储资源,将 为用户提 供本地支持, 以此提高 用户体验 质量
(Quality of Experience,QoE)。然而,单个 MEC 服务器的计算能力和存储能力相
较于云中心是十分有限的,为了降低回程链路流量和更好提升用户的 QoE,我们提
出 MEC 协作域的概念。依据地域特征将多个基站划分成一个协作区域,下述简称协
作域。一个协作域域内的 MEC 相互协作,共同完成对协作域内用户请求内容的处
理。一个 MEC 具备编解码、视频拼接等计算能力和 缓存热点内容的存储能力。一个
协作域内存储着一份 VR 视频的全景低码率版本,每个 MEC 独立运行对高码率 tile
块的缓存策略。具体来说,依据本管辖区域内用户对 tile 块的请求频率和该 tile 块与
管辖区域内用户的偏好相似度来决定是否缓存该 tile 块的高码率版本。
VR 视频终端:VR 视频终端包括 Wi-Fi 模块、解码、视频帧处理、播放操作控
制和显示处理 等模块, 具备解码、姿 态感知、 运动轨迹预测 、实时模 型渲染和呈现
等能力。目前 VR 视频主流分辨率为 4K,但高质量的 VR 视频分辨率需至少达到 8K
以上,更高可达到 30K。因此,终端典型的单眼分辨率需达到 2K 及以上,硬件需支
4
持 8K 解码能力,终端头动感知时延应小 于 20ms,同时还需具备高性能的通信能力。
用户请求一个 FOV 时,MEC 协作传输架构的运作流程 如下:
步骤 1:VR 终端设备跟踪用户头部运动轨迹,当用户视角发生变化时,向 home
BS 请求用户需要的 FOV。在我们的发明中,MEC 部署在 BS 上,因此也可以说是终
端向 home MEC 请求需要的 FOV。
步骤 2:home MEC 接收到 VR 终端设备的 FOV 请求后,分析构成该 FOV 的高
码率 tile 块集合𝑇。
步骤 3:home MEC 如果缓存了集合𝑇包含的所有高码率 tile 块和一个低码率的
全视角视频,就将这两个视频流文件压缩发送给 VR 终端设备。然后转步骤 6,否则
转步骤 4。
步骤 4:home MEC 如果只缓存了集合𝑇中的部分 tile 块,那么就需要向协作域
内的其他 MEC 请求其欠缺的 tile 块。若协作域不能满足集合𝑇中所有高码率 tile 块
的请求,home MEC 就需要向中心云请求相应 tile 块。当集合𝑇中所有的 tile 块都凑
齐,并且 home MEC 准备好一个低码率全视角视频后,home MEC 就压缩这两个视
频文件,然后响应给 VR 终端设备。其中,低码率全视角视频的获取,可能是 home
MEC 本身就存储着,也可能是从协作域内其他 MEC 上请求得来,甚至是从中心云
获取。转步骤 5。
步骤 5:当 home MEC 上有新 tile 块到达时,如果此时的存储空间剩余大小足够
容纳该 tile,那么就直接缓存下这个新 tile 块。而如果存储空间已满,那么就 需要计
算已存 tile 块的流行度和新 tile 块的流行度,依据流行度来决定是否删除已存 tile 块
和缓存下新 tile 块。当 home MEC 从中心云获取到低码率全视角视频时,说明协作
域内没有存储这个内容,而一个 MEC 协作域内只会存一份低码率全视角视频,因此
该低码率全视角视频便直接存储在 home MEC 上。如果 home MEC 上没有足够的存
储 空 间 , 那 么 就 将 低 码 率 全 视 角 视 频 传 到 距 离 home MEC 较 近 且 存 储 空 间 充 足 的
MEC 上存储。转步骤 6。
步骤 6:VR 终端设备接收到请求的 FOV 视频流文件,进行解码、渲染展示在
显示器上。
所属步骤 5 中的流行度计算可以公式 1 得到。tile 块的流行度由 tile 块与 home
MEC 区域内用户偏好的相似度𝑠𝑖𝑚(𝐾, 𝐾𝑡 )和其最近一个时隙𝑡内的访问频率𝑓𝑡(𝑡)共同
得到。
𝑝(𝑡) = 𝑠𝑖𝑚(𝐾, 𝐾𝑡 ) × 𝑓𝑡(𝑡)
(1)
在 计算 相似 度时 , MEC 区 域内 用户 的偏 好表 示成 关键 词向 量𝐾 = {< 𝑘1 , 𝑤1 >, <
𝑘2 , 𝑤2 >, . . . , < 𝑘𝑛 , 𝑤𝑛 >},𝑤𝑛 表 示关 键词 的权 重, tile 块 表 示成 向量K t = {< 𝑘1 , 𝑑1 >, <
𝑘2 , 𝑑2 >, . . . , < 𝑘𝑛 , 𝑑𝑛 >},𝑑𝑛 表示关键词𝑘𝑛 对 tile 块的重要程度。在公式 2 中采用余弦
公式来计算两个向量之间的距离。
5
𝑠𝑖𝑚(𝐾, 𝐾𝑡 ) =
𝐾⋅𝐾
||𝐾|| × ||𝐾𝑡 ||
(2)
tile 块最近一个时隙𝑡的访问频率由公式 3 得出。其中,𝑅𝑡 表示某一个 tile 块被
请求的次数,𝑡𝑜𝑡𝑎𝑙𝑡 表示 MEC 上 tile 块被请求的总次数。新 tile 块最近一个时隙𝑡的
访问频率不采用公式 3 来计算,访问频率设置为 1。
ft(t) =
𝑅𝑡
𝑡𝑜𝑡𝑎𝑙𝑡
(3)
与现有 VR 视频传输技术相比,本发明所达到的有益效果如下:
1.
克服单 MEC 的计算能力和存储能力的限制 ,协同多个 MEC 共同来处理用
户请求,充分利用多个 MEC 的计算和存储资源,提升最大可服务的用户数
量和降低用户平均内容请求时延。
2.
本发明以 tile 块为基本单位来存储 VR 视频文件,更节省 MEC 的存储空间。
由于 FOV 可能存在重叠的区域,也就意味着它们有部分相同的高码率 tile
块,在我们的发明中,MEC 上只需要存储这些高码率 tile 块的一个副本,
比独立地存储单个 FOV 来说,更加节约存储空间。
3.
本发明提出依据 tile 块的流行度来决定是否缓存 tile 块,与传统的缓存算法
相比,更能充分利用 MEC 存储空间和提高缓存命中率。
附图说明
图 1 360°全景 VR 视 频 的 端到 端系 统框 架 图( 这个 图或 许可 以不 附 上)
6
5G核心网
移动交换
节点
回传
网络
home MEC
home BS
user
图 2 基于 5G 网 络 的 MEC 协 作传 输 VR 视 频架 构 模型
具体实施方式
下面将结合附图和具体实施方式对本发明作进一步的详细说明 。基于图 2 所示
传输架构,当用户请求一个 FOV 时,系统工作流程如下:
步骤 1:VR 终端设备跟踪用户头部运动轨迹,当用户视角发生变化时,向 home
BS 请求用户需要的 FOV。在我们发明的方案中,MEC 部署在 BS 上,因此也可以说
是终端向 home MEC 请求需要的 FOV。
步骤 2:home MEC 接收到 VR 终端设备的 FOV 请求后,分析构成该 FOV 的高
码率 tile 块集合𝑇。
步骤 3:home MEC 如果缓存了集合𝑇包含的所有高码率 tile 块和一个低码率的
全视角视频,就将这两个视频流文件压缩发送给 VR 终端设备。然后转步骤 6,否则
转步骤 4。
步骤 4:home MEC 如果只缓存了集合𝑇中的部分 tile 块,那么就需要向协作域
内的其他 MEC 请求其欠缺的 tile 块。若协作域不能满足集合𝑇中所有高码率 tile 块
的请求,home MEC 就需要向中心云请求相应 tile 块。当集合𝑇中所有的 tile 块都凑
齐,并且 home MEC 准备好一个低码率全视角视频后, home MEC 就压缩这两个视
频文件,然后响应给 VR 终端设备。其中,低码率全视角视频的获取,可能是 home
MEC 本身就存储着,也可能是从协作域内其他 MEC 上请求得来,甚至是从中心云
获取。转步骤 5。
7
步骤 5:当 home MEC 上有新 tile 块到达时,如果此时的存储空间剩余大小足够
容纳该 tile,那么就直接缓存下这个新 tile 块。而如果存储空间已满,那么就需要计
算已存 tile 块的流行度和新 tile 块的流行度,依据流行度来决定是否删除已存 tile 块
和缓存下新 tile 块。当 home MEC 从中心云获取到低码率全视角视频时,说明协作
域内没有存储这个内容,而一个 MEC 协作域内只会存一份低码率全视角视频,因此
该低码率全视角视频便直接存储在 home MEC 上。如果 home MEC 上没有足够的存
储 空 间 , 那 么 就 将 低 码 率 全 视 角 视 频 传 到 距 离 home MEC 较 近 且 存 储 空 间 充 足 的
MEC 上存储。转步骤 6。
步骤 6:VR 终端设备接收到请求的 FOV 视频流文件,进行解码、渲染展示在
显示器上。
权利要求书
1. 一种基于 5G 网络的 MEC 协作传输 VR 视频架构方案,其特征在于:
步骤 1:VR 终端设备向 home MEC 发出 FOV 请求。
步骤 2:home MEC 处理该请求,分析需要的 tile 块集合。
步骤 3:如果 home MEC 本地存储着构成被请求 FOV 的高码率 tile 块集合
和一个低码率全视角视频,则编码压缩两个文件,然后响应给 VR 终端设备
接着转步骤 6,否则转步骤 4。
步骤 4:home MEC 从本地存储、协作域内其他 MEC 处或者中心云上多个
途径以得到构成被请求 FOV 的高码率 tile 块集合和一个低码率全视角视频,
编码压缩两个文件,再响应给 VR 终端设备。转步骤 5。
步骤 5:home MEC 执行缓存策略。以 tile 块的流行度来决定是否缓存 tile
块。tile 块的流行度由 tile 块与 home MEC 区域内用户偏好的相似度其最近
一个时隙𝑡内的访问频率同得到 。
步骤 6:VR 终端设备接收到请求的 FOV 视频流文件,进行解码、渲染展示
在显示器上。
2. 所属步骤 5 中的流行度计算可以公式 1 得到。tile 块的流行度由 tile 块 与
home MEC 区域内用户偏好的相似度 sim(K,K_t)和其最近一个时隙 t 内的访
问频率 ft(t)共同得到。
p(t) = sim(K, K t ) × ft(t)
(1)
在计算相似度时,MEC 区域内用户的偏好表示成关键词向量 𝐾 = {< 𝑘1 , 𝑤1 >
, < 𝑘2 , 𝑤2 >, . . . , < 𝑘𝑛 , 𝑤𝑛 >},𝑤𝑛 表示关键词的权重,tile 块表示成向量𝐾𝑡 = {<
𝑘1 , 𝑑1 >, < 𝑘2 , 𝑑2 >, . . . , < 𝑘𝑛 , 𝑑𝑛 >},𝑑𝑛 表示关键词𝑘_𝑛 对 tile 块 的重要程度。
在公式 2 中采用余弦公式来计算两个向量之间的距离。
8
sim(K, K t ) =
K⋅K
||K|| × ||K t ||
(2)
tile 块最近一个时隙𝑡的访问频率由公式 3 得出。其中,𝑅𝑡 表示某一个 tile 块
被请求的次数,𝑡𝑜𝑡𝑎𝑙𝑡 表示 MEC 上 tile 块被请求的总次数。新 tile 块最近一
个时隙𝑡的访问频率不采用公式 3 来计算,访问频率设置为 1。
ft(t) =
𝑅𝑡
𝑡𝑜𝑡𝑎𝑙𝑡
9
(3)
Download