运动估计的运动估计算法 运动估计算法是视频压缩编码的核心算法之一。高质量的运动估计算法是高效视频编码的前提和基础。其中块匹配法(BMA,Block Match Algorithm)由于算法简单和易于硬件实现,被广泛应用于各视频编码标准中。块匹配法的基本思想是先将图像划分为许多子块,然后对当前帧中的每一块根据一定的匹配准则在相邻帧中找出当前块的匹配块,由此得到两者的相对位移,即当前块的运动矢量。在H.264标准的搜索算法中,图像序列的当前帧被划分成互不重叠16×16大小的子块,而每个子块又可划分成更小的子块,当前子块按一定的块匹配准则在参考帧中对应位置的一定搜索范围内寻找最佳匹配块,由此得到运动矢量和匹配误差。运动估计的估计精度和运算复杂度取决于搜索策略和块匹配准则。这里使用H.264推荐算法UMHexagonS(Unsymmetrical-cross Multi-Hexagon-grid Search)作为DSP实现的算法参考,与FS算法比较,它在保证可靠搜索精度的前提下大幅降低搜索复杂度。同时使用绝对差和(SAD,the Sum of Absolute Difference)标准作为匹配准则,它具有便于硬件实现的优点。
计算机视觉中,目前有哪些经典的目标跟踪算法? 以及VOT2016的冠军 TCNN http://www. votchallenge.net/vot201 6/download/44_TCNN.zip,速度方面比较突出的如80FPS的 SiamFC SiameseFC tracker 和100FPS的 GOTURN davheld/。
运动估计的准则分类 运动搜索的目的就是在搜索窗内寻找与当前块最匹配的数据块,这样就存在着如何判断两个块是否匹配的问题,即如何定义一个匹配准则。而匹配准则的定义与运算复杂度和编码效率都是直接相关的,通常有如下几类比较常用的匹配函数的定义:设当前帧 f2,参考帧f1,(1)最小均方差函数(MSE)MSE(MV)=Σ|f2(x,MV)-f1(x)|2(3.34)(2)最小平均绝对值误差(MAD)等效于常用的绝对差值和(SAD)准则,性能很好,而且相对简单的硬件需求,因而得到了最广泛的应用。MAD(MV)=Σ|f2(x,MV)-f1(x)|(3.35)(3)阈值差别计数(NTD)NTD(MV)=ΣG(f2(x,MV)-f1(x))(3.36)其中:当|α-β|>;T0 时,G(α,β)=1;当|α-β|时,G(α,β)=0(3.37)由于在用块匹配算法进行运动估计的过程中,利用匹配准则函数进行匹配误差的计算是最主要的计算量,因此,我们可以从这方面进一步减少计算量。由于图象的帧内也具有相关性,在计算误差匹配函数时,可以只让图象块中的部分像素参与运算,将块中的所有像素组成一个集合,那么参与计算的这部分像素集合就是它的子集,这种误差匹配的方法被称为子集匹配法。实验结果表明,在匹配误差无明显增加的情况下,采用子集。