ZKX's LAB

运动估计全搜索算法 计算机视觉中,目前有哪些经典的目标跟踪算法?

2021-03-25知识12

运动估计的准则分类 运动搜索的目的就是在搜索窗内寻找与当前块最匹配的数据块,这样就存在着如何判断两个块是否匹配的问题,即如何定义一个匹配准则。而匹配准则的定义与运算复杂度和编码效率都是直接相关的,通常有如下几类比较常用的匹配函数的定义:设当前帧 f2,参考帧f1,(1)最小均方差函数(MSE)MSE(MV)=Σ|f2(x,MV)-f1(x)|2(3.34)(2)最小平均绝对值误差(MAD)等效于常用的绝对差值和(SAD)准则,性能很好,而且相对简单的硬件需求,因而得到了最广泛的应用。MAD(MV)=Σ|f2(x,MV)-f1(x)|(3.35)(3)阈值差别计数(NTD)NTD(MV)=ΣG(f2(x,MV)-f1(x))(3.36)其中:当|α-β|>;T0 时,G(α,β)=1;当|α-β|时,G(α,β)=0(3.37)由于在用块匹配算法进行运动估计的过程中,利用匹配准则函数进行匹配误差的计算是最主要的计算量,因此,我们可以从这方面进一步减少计算量。由于图象的帧内也具有相关性,在计算误差匹配函数时,可以只让图象块中的部分像素参与运算,将块中的所有像素组成一个集合,那么参与计算的这部分像素集合就是它的子集,这种误差匹配的方法被称为子集匹配法。实验结果表明,在匹配误差无明显增加的情况下,采用子集。

运动估计全搜索算法 计算机视觉中,目前有哪些经典的目标跟踪算法?

寻找会做运动估计的达人 运动估计基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。常见的运动估计匹配准则有三种:MAD、MSE和NCCF,由于MAD没有乘除操作,不需做乘法运算,实现简单方便,所以使用较多。通常使用求和绝对误差(SAD)代替MAD。运动估计和运动补偿是AVS 中去除时间冗余的主要方法,它采用多种宏块划分方式,1P4 像素插值、双向估计和多参考帧等技术大大提高了编码效率,但同时也给编解码器增加了一定的复杂度。运动估计和运动补偿作为视频压缩编码系统的核心算法,占整个系统运算量的60%-80%。研究运动估计算法的DSP实现对整个H.264系统的嵌入式应用具有重要的指导意义。运动估计算法运动估计算法是视频压缩编码的核心算法之一。高质量的运动估计算法是高效视频编码的前提和基础。其中块匹配法(BMA,Block Match Algorithm)由于算法简单和易于硬件实现,被广泛应用于各视频编码标准中。块匹配法的基本思想是先将图像划分为。

当前,随着数字电视技术的发展,出现了很多不同的数字视频标准。从高清晰电视(HDTV)到视频电话,它们都具有一定的时间和空间分辨率要求,电影节目源是以24帧/s播放,而电视NTSC则是以60场/s的速率来播放。视频标准转换的任务就是把数字视频信号从一种标准转化为另一种标准,或者把一种格式节目源转化成另一种格式的节目源。数字视频标准转换主要包含帧/场速率的上变换/下变换、隔行化/去隔行、图像空间分辨率变换。帧速率上变换是指提高视频信号的时间分辨率,例如,为了能够让电影节目源在电视设备上播放,必须提高节目源的时间分辨率(24帧/s)到播放设备要求的时间分辨率(假定为30帧/s),因此,上变换要求在视频信号中增加一些新帧来满足播放设备的需要。随着新帧产生方法的不同,上变换算法可以分为两类:(1)利用已存在的视频帧线性组合的方法来产生新帧,主要特点是没有考虑目标运动信息,这类算法包括帧重复、线性图像插值。帧重复是最简单的方法,但是当帧中存在运动目标时,会产生严重的动作突变现象。线性图像插值是指利用两源帧的线性组合产生新帧,此方法假设像素亮度线性变化,从而能得到更加自然的图像序列,但会产生明显的运动模糊现象,。

#运动估计全搜索算法

随机阅读

qrcode
访问手机版