ZKX's LAB

能否具体解释下svo的运动估计与深度估计两方面的知识? 基于块的运动估计方法

2020-10-03知识2

运动估计的表示法 由于在成象的场景中一般有多个物体作不同的运动,如果直接按照不同类型的运动将图像分割成复杂的区域是比较困难的。最直接和不受约束的方法是在每个像素都指定运动矢量,这就是所谓基于像素表示法。这种表示法是对任何类型图像都是适用的,但是它需要估计大量的未知量,并且它的解时常在物理上是不正确,除非在估计过程中施加适当的物理约束。这在具体实现时是不可能的,通常采用基于块的物体运动表示法。帧间编码宏块中的每个块或亚宏块分割区域都是根据参考帧中的同尺寸的区域预测得到的,它们之间的关系用运动矢量来表示。由于自然物体运动的连续性,相邻两帧之间的块的运动矢量不是以整像素为基本单位的,可能真正的运动位移量是以 1/4 像素或者甚至 1/8 像素等亚像素作为为单位的。图 3.17 给出了一个视频序列当采用 1/2 像素精度、1/4 像素精度和 1/8 像素精度时编码效率的情况,从图中可以看到 1/4像素精度相对于 1/2 像素精度的编码效率有很明显的提高,但是 1/8 像素精度相对于 1/4像素精度的编码效率除了在高码率情况下并没有明显的提高,而且 1/8像素的内插公式更为复杂,因此在 H.264的制定过程中 1/8 像素精度的运动矢量模型逐渐被取消而只采用了 。

能否具体解释下svo的运动估计与深度估计两方面的知识? 基于块的运动估计方法

能否具体解释下svo的运动估计与深度估计两方面的知识? 1.SVO 简介SVO 全称 Semi-direct monocular Visual Odometry(半直接视觉里程计),是苏黎世大学机器人感知组的克里斯蒂安.弗斯特(Christian Forster,主页:Christian Forster)等人,于2014年ICRA会议上发表的工作,随后在github开源:uzh-rpg/rpg_svo。2016年扩展了多相机和IMU之后,写成期刊论文,称为SVO 2.0,预定将在IEEE Trans.on Robotics上发表(视频见[2])。SVO 2.0目前未开源(个人认为以后也不会开)。SVO主要工作由弗斯特完成,此外他也在乔治亚理工的gtsam组呆过一段时间,参与了gtsam中IMU部分,文章发表在RSS 2015上,亦是VIO当中的著名工作[3]。此文章后续亦有期刊版本,预计也在TRO上发表。不过会议论文中公式推导有误,而且弗斯特本人似乎只参与了实现部分,没怎么管公式推导…当然这些都是八卦,不谈了。与SVO相关工作是同一组的REMODE[4],实现了在SVO定位基础上的单目稠密建图(需要GPU),由SVO的二作马蒂亚(Matia Pizzoli)完成。SVO,虽然按照作者的理解,称为“半直接法”,然而按照我个人的理解,称为“稀疏直接法”可能更好一些。众所周知,VO主要分为特征点法和直接法。而SVO的实现中,混合使用了特征点与直接法:它跟踪了一些关键点(角点。

能否具体解释下svo的运动估计与深度估计两方面的知识? 基于块的运动估计方法

视频编码的构成原理 使用帧间编码技术可去除时域冗余信息,它包括以下三部分:运动补偿运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。运动表示不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。运动估计运动估计是从视频序列中抽取运动信息的一整套技术。注:通用的压缩标准都使用基于块的运动估计和运动补偿。主要使用帧内编码技术和熵编码技术:变换编码帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。量化编码经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。熵编码熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。

能否具体解释下svo的运动估计与深度估计两方面的知识? 基于块的运动估计方法

试简介视频编码技术? 我需要宏观的关于视频编码的指导,最好是基于HEVC的编码器原理。如帧间预测编码过程,帧内预测编码过程,…

随机阅读

qrcode
访问手机版