文章名与作者单位列出如下,来自清华大学刘永攀组。
从名称可知,这个work主要目标是部署一个能够感知两次activation输入相似性的CNN神经网络。由于在视频处理中,相邻的两帧之间差别很小。把相邻的两帧作差,得到的feature map包含大量的sparsity (为0的值)。
软件层面,控制帧重用的flow的工作模式如下:
对神经网络的每一层,第一帧作为一个完整的图像进行处理,但接下来的帧仅仅处理与上一帧作差的结果,我将其称为帧间残差(difference frame)。由于帧间相似性,这个difference frame可以被量化为4b低精度矩阵与8b高精度稀疏矩阵的结合,之后可对两部分矩阵可以进行分治操作。由于ReLU操作的处理目标为原始图像,神经网络中除ReLU以外的所有操作都由difference frame作input activation。在进行ReLU之前,difference frame将会还原当前帧的原始图像(Recover frame),上图中左路的分支为当前帧的原始图像,而右路分支为前一帧。两者都进行ReLU之后,再重新生成difference frame ...