VCIP-2021-基于神经网络的双向预测混合

本文来自VCIP 2021的论文《Neural Network based Inter bi-prediction Blending》

本文思路来自提案JVET-V0076,提出了一个基于全卷积的双向加权预测网络。

网络框架如下所示,网络总共包括6层卷积,除最后一层外卷积层的激活函数都是ReLu,对于网络的最终输出预测值需要进行clip操作。输入块边界填充长度为N的像素。

该网络应用VTM时,不需要传输码流,仅在满足特定条件时使用该网络进行加权预测,其余情况仍使用原来的加权预测方式(网络的作用类似BDOF工具,因此在该测试中,BDOF被停用)。网络加权仅应用于亮度分量,色度分量仍然使用平均加权预测。本文设计了三种应用条件

 为了评估网络大小对性能的影响,本文提出了两种网络版本,N=5 or N=6。下表显示了每个网络的复杂度和内存使用情况,MAC/pixel反映了网络的计算复杂性,以及最大层所需内存带宽的峰值内存使用量。

 为了降低计算复杂度,框架使用整数计算,网络参数在16位上量化,内部计算在32位上完成,中间值在16位上量化。

使用TensorFlow 2.0进行训练,训练集采用BVI-DVC和UVG数据集,训练信息如下表所示。使用应用BDOF的编码块作为网络的输入,STAD Loss作为损失函数

 实验结果

Anchor为VTM11.0,编码Qp包括{22,27,32,37,42}

不同网络大小的比较:(Small表示N=5, Medium表示N=6)

 不同应用条件的比较:

猜你喜欢

转载自blog.csdn.net/BigDream123/article/details/122704114