程序员人生网站导航

立体匹配的研究背景以及意义

栏目：综合技术时间：2016-06-24 08:28:47

转载请注明出处：http://blog.csdn.net/wangyaninglm/article/details/51533549，
来自：
shiter编写程序的艺术

计算机视觉是1门研究使用计算机来摹拟人的视觉系统的学科。“1图胜千言”，人类对图象中的信息感知效力远超文字等其他媒介，人类获得的信息总量中更是有高达80%依托视觉系统[1]。相对人类高效的图象信息提取能力，计算机在图象信息的理解上依然效力低下。
计算机视觉作为1门交叉学科，综合了生物学，心理学，数学，计算机科学等学科，从20世纪60年代至今其在科学研究领域中的大量成果已利用于工程领域，并影响了我们每一个人生活的各个方面。
双目立体视觉是计算机视觉领域的重要分支，它通过摹拟人的视觉系统来处理现实世界。以机器人，无人汽车导航为例，由于双目立体匹配在非接触丈量中的优秀性能，视觉丈量在探月工程，火星探测工程中起到了重要作用[2]，如图所示的我国嫦娥探月工程的巡航车就配备了立体视觉导航系统，来进行行进间的运动控制和路径计划[3]。
这里写图片描述

1.1 研究背景与意义

立体匹配是1种从平面图象中恢复深度信息的技术。由于双目立体匹配系统通过摹拟人眼视觉感知原理，仅需要两台数字摄像机安装在同1水平线上，经过立体改正就能够投入使用。具有实现简单，本钱低廉，并且可以在非接触条件下丈量距离等优点。在机器人制导系统中可以用于导航判断、目标拾取，在工业自动化控制系统中可用于零部件安装、质量检测，环境检测，在安防监控系统中可用于人流检测，危害报警。
这里写图片描述

最近几年来，随着社会的科技进步，立体匹配技术的发展日新月异，随着匹配算法精度与速度的提高，其利用场景进1步扩大。在此背景下，研究立体匹配变的意义非凡。
立体匹配作为3维重建、立体导航、非接触测距等技术的关键步骤通过匹配两幅或多幅图象来获得深度信息。并且广泛利用于，工业生产自动化、流水线控制、无人驾驶汽车（测距，导航）、安防监控、遥感图象分析、机器人智能控制等方面。虽然立体匹配利用广泛但是还有很多还没有解决的困难因此该技术成了最近几年来计算机视觉领域广泛关注的难点和热门。
立体匹配作为1种工程化问题，在实行进程中有多种因素影响其精度与速度，并没有1种复杂算法可以完全的处理立体匹配的全部流程，本文所述算法主要针对峙体匹配中图象像素匹配并计算视差这1核心步骤。

通常根据立体匹配算法所采取的束缚，可以将其分为两大类算法[5]：
这里写图片描述
第1类为基于区域束缚的局部匹配算法。如采取匹配窗的代价聚合算法（平方差算法SSD，绝对差算法SAD，归1化算法NCC等）；采取特点点的匹配算法；采取相位匹配的的匹配算法。这些算法的优点是运算速度快，能够快速恢复出纹理丰富区域的视差。缺点是在低纹理区域会造成误匹配[6]，得到的视差图不致密，需要在后期通过插值算法来进行修正。
第2类为基于全局束缚的优化算法，如图割算法(Graph Cuts, GC)，人工智能算法（神经网络，遗传算法），置信传播算法(Belief Propagation, BP)，动态计划算法(Dynamic Programming, DP)。这些算法虽然运算时间较长并且会产生1些误匹配，但是基本上能够取得所有的视差信息从而生成稠密的视差图。

1.2 国内外研究现状

国外在计算机立体视觉上的研究展开较早，Roy[7]最早将图割算法利用于立体匹配，并通过实验表明，图割算法能有效克服其他全局优化算法的缺点（如动态计划算法等生成视差图产生的横向条纹瑕疵），避免了视差在邻近极线处不连续的问题。但该算法生成的视差图轮廓边沿模糊，视差层的辨别度低。Geiger等[8]，针对高分辨率图象立体匹配运算时间长的问题，创造性的提出了使用强束缚点（纹理或特点信息较为丰富）作为支持点，在强束缚点之间通过3角剖分对视差图进行插值计算，结合OpenMP技术在通用CPU上实现了并行计算，操作简单易于搭建环境，在通用微型计算机上实现了实时立体匹配，但是匹配效果和基于全局优化的匹配算法有1定差距。
这里写图片描述
国内对立体视觉的研究起步较晚，初期主要采取基于特点点匹配的方法，随着技术的进步，后序对峙体匹配的改进工作主要集中在对全局优化算法性能和准确度的提升上。其中大部份方法采取对待匹配图象进行图象分割后，再结合能量最优化的方法进行立体匹配。如尹等[9]采取均值平移算法将参考图象根据色彩信息快速聚类；以后计算初始视差图；将分割结果作为能量视差函数的1个参考项；最后采取图割算法求取使全局能量最小的视差最优分配。此种基于图象分割的立体匹配方法的理论基础认为，分割区域块内的视差变化是平滑的。因此与其他基于图象分割的立体匹配算法相比，此类算法[9]可有效地处理大块低纹理区域，匹配精度高，更有益于估计视差图的边界。并且上述算法通过分割减少了匹配基元，使得运算速度更快，能够很好的解决的边界模糊和低纹理区域的误匹配问题。
这里写图片描述
立体匹配技术的利用10分广泛，王等[6]改进了勇气号机遇号火星车复杂的定位技术，在嫦娥3号月面巡航器的视觉导航系统中，将SIFT(scale-invariant feature transform) 匹配、相干系数匹配、最小2乘匹配和光束法平差等多项技术融会, 实现了相邻站间月面巡查器的导航定位. 实验表明视觉定位相对精度优于4%。
朱[8]针对工件的自动定位、辨认与抓取等问题，使用立体视觉的方法进行工件辨认的定位；对图象就行SIFT特点提取，并采取模板匹配方法实现工件的辨认。用形态学方法取得工件特点点的2维信息,结合双目立体视觉标定技术得到工件的3维坐标，为机器人抓取工件提供信息。
顾等[9]为实现统计实时人流，提出1种基于立体视觉的人头检测算法。该方法对双目相机收集的图象通过运动目标检测分离出运动人员所在区域，利用视差的连续性只对强纹理点进行绝对误差积累(SAD)匹配，其余点只进视差验证，因此能够得到稠密的视差图，再由3角投影关系计算出深度图。由于双目立体成像得到的深度图中人员与场景的深度散布不同，采取深度分层的方法将存在人头信息的深度层提取出来，并通过几何形态来肯定人头，该算法可以很好地适应复杂场景下的人头检测，精度高、速度快。
这里写图片描述
Yang等[11]，提出了采取全局最小生成树的代价聚合方案，像素间的类似性作为边的权值，通过无向连通图构建最小生成树，使得局部像素点获得了全局的信息。解决了低纹理区域的误匹配问题。（实际为对局部窗匹配算法的改进。），针对收集的待匹配图象可能带有噪声或复杂纹理的问题，该团队进行了系统化流程的设计改进[14]。

顾等[11]为实现统计实时人流，提出1种基于立体视觉的人头检测算法。该方法对双目相机收集的图象通过运动目标检测分离出运动人员所在区域，利用视差的连续性只对强纹理点进行绝对误差积累(SAD)匹配，其余点只进行视差验证，因此能够得到稠密的视差图，再由3角投影关系计算出深度图。由于双目立体成像得到的深度图中人员与场景的深度散布不同，采取深度分层的方法将存在人头信息的深度层提取出来，并通过几何形态来肯定人的头部，该算法可以很好地适应复杂场景下的人头检测，并且由于采取了基于局部优化的匹配算法结合插值计算等手段所以其在精度、速度上都有很好的实时特性。

Yang等[12]，提出了基于最小生成树的代价聚合方案，采取像素间的类似性作为边的权值，通过无向连通图构建最小生成树，使得局部像素点获得了全局的信息。解决了低纹理区域的误匹配问题。针对收集的待匹配图象可能带有噪声或复杂纹理的问题，Yang等在上述算法的基础上进行了系统化的流程设计与改进[13]，利用左右交叉检验精确更新代价聚合中稳定和不稳定的点的代价，提升了算法精度。
立体匹配算法的改进，最近几年来主要围绕如何快速获得稠密视差图和将匹配算法并行化，Yang等[12][13]，利用保边滤波器的性质并加以改进，融会并行计算技术，分别用导向滤波器和双边滤波器，针对局部匹配算法和全局匹配算法提出了工程化系统化的立体匹配并行流程方法。
这里写图片描述

参考文献

[1]马颂德,张正友. 计算机视觉—计算理论与算法基础[M].北京:科学出版社,1997.
[2]邸凯昌. 勇气号和机遇号火星车定位方法评述[J]. 航天器工程, 2009, 18(5):1⑸.
[3]吴伟仁, 王大轶, 邢琰,等. 月球车巡查探测的双目视觉里程算法与实验研究[J]. 中国科学:信息科学, 2011(12):1415⑴422.
[4]王保丰, 周建亮, 唐歌实,等. 嫦娥3号巡查器视觉定位方法[J]. 中国科学：信息科学, 2014, 04期(04):452⑷60.
[5]白明, 庄严, 王伟. 双目立体匹配算法的研究与进展[J]. 控制与决策, 2008, 23(7):721⑺29. DOI:doi:10.3321/j.issn:1001-0920.2008.07.001.
[6]张令涛, 曲道奎, 徐方. 1种基于图割的改进立体匹配算法[J]. 机器人, 2010, 32(1):104⑴08.
[7]Roy S, Cox I J. A maximum-flow formulation of the n-camera stereo correspondence problem[A]// IEEE International Conference on Computer Vision[A], 1998 January 4⑺, Bombay India:492⑷99.
[8]Geiger A, Roser M, Urtasun R. Efficient large-scale stereo matching[M]//Computer Vision–ACCV 2010. Springer Berlin Heidelberg, 2011: 25⑶8.
[9]尹传历, 刘冬梅, 宋建中. 改进的基于图象分割的立体匹配算法[J]. 计算机辅助设计与图形学学报, 2008, 20(6):808⑻12.
[10]朱代先. 基于双目视觉的工件定位与抓取研究[J]. 计算机丈量与控制, 2015, 19(1):92⑼4.
[11]顾骋, 钱惟贤, 陈钱,等. 基于双目立体视觉的快速人头检测方法[J]. 中国激光, 2014, 01期(01):150⑴55.
[12]Yang Q. A non-local cost aggregation method for stereo matching[C]// Proceedings / CVPR, IEEE Computer Society Conference on Computer Vision and Pattern Recognition. IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2012:1402⑴409.
[13]Yang Q. Stereo Matching Using Tree Filtering[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015, 37(4):834⑻46.
[14]Yang Q. Hardware-efficient bilateral filtering for stereo matching[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2014, 36(5): 1026⑴032.
[15]Yang Q, Li D, Wang L, et al. Full-Image Guided Filtering for Fast Stereo Matching[J]. IEEE Signal Processing Letters, 2013, 20(3):237⑵40.
[16]Yang Q, Ji P, Li D, et al. Fast stereo matching using adaptive guided filtering[J]. Image and Vision Computing, 2014, 32(3): 202⑵11.

转载请注明出处：http://blog.csdn.net/wangyaninglm/article/details/51533549，
来自：
shiter编写程序的艺术

------分隔线----------------------------

上一篇 客户端调用服务端接口减少请求数据容量的优化例子

下一篇 Android Studio之基本Gradle使用

------分隔线----------------------------