光学 精密工程  2018, Vol.26 Issue (10): 2565-2574   PDF    
归一化互相关中计算基准子图能量的快速递推
韩冰1, 牟忠锋1, 乐小峰1, 贾小志1, 石选卫1, 李贝贝1,2     
1. 长光卫星技术有限公司, 吉林 长春 130033;
2. 中国科学院 长春光学精密机械与物理研究所, 吉林 长春 130033
摘要: 景象匹配对匹配算法的运行速度和内存占用均要求较高。为提升归一化互相关算法的运行速度并降低其内存占用率,本文重点对其中的基准子图能量计算步骤进行了加速研究。经过详细分析,积分图法具有灵活、快速的优点,但缺陷为其在快速计算的同时需花费较大内存,并不适合直接应用在嵌入式系统中。本文提出了一种快速递推算法。该算法利用相邻像素值的能量进行连续递推,计算时可以不必像积分图法那样给所有的图像能量都分配空间,只需预留1行的像素空间便能完成整个能量计算过程。实验结果表明:在时间花费方面,快速递推法具有和积分图法相当的运算速度,耗时均只为传统归一化互相关算法的1/2;在内存占用率方面,快速递推法约为积分图法的1/3以下,且实时图尺寸越大,快速递推法占用的内存越小。综上所述,在归一化互相关算法中利用经典积分图法和本文提出的快速递推法计算基准子图能量,均较传统NCC算法有所加速,两种算法各具优点,经典积分图法快速、灵活,适用于对速度要求高,但对内存占用率要求不太高的应用场景;而快速递推法快速、省内存,更适用于嵌入式系统的应用。
关键词: 归一化互相关      基准子图能量      经典积分图法      快速递推法     
Fast recurrence algorithm for computing sub-Image energy using normalized cross correlation
HAN Bing1 , MU Zhong-feng1 , LE Xiao-feng1 , JIA Xiao-zhi1 , SHI Xuan-wei1 , LI Bei-bei1,2     
1. Chang Guang Satellites Technology Co. Ltd, ChangChun 130033, China;
2. Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences, ChangChun 130033, China
*Corresponding author: HAN Bing, E-mail:13911799042@qq.com
Abstract: Scene matching requires higher matching speed and memory usage. In order to improve the running speed of the normalized cross correlation algorithm and reduce its memory occupancy rate, this paper focus on researching the steps of fast calculating sub-image's energy. After detailed analysis, the integral graph method has the advantages of flexible and rapid, but the defect is that it needs to spend a lot of memory at the same time, while it is not suitable for the embedded system. Therefore, a fast recurrence method was proposed. In this method, the energy of adjacent pixel values is used to continuously recursive compute. It is not necessary to allocate space for all image energy as the integral image method in the calculation process. Only one row of space can be reserved for the entire energy calculation process in fast recurrence method, which greatly saves the memory usage. The fast recurrence method has the equivalent calculation speed with the integral image method, and the time consuming is only 1/2 of the traditional normalization cross correlation algorithm. In the memory occupancy rate, the fast recurrence method is less than 1/3 of the integral image method, and the larger the size of the real-time graph, the less memory occupied by the fast delivery method. In the normalized cross correlation algorithm, the classical integral graph method and the fast recursive method proposed in this paper are used to calculate the energy of the sub-image's energy, which are both faster than the traditional NCC algorithm. The two algorithms have their advantages. The classical integration image method is fast and flexible, which is suitable for the application scene with high speed requirements, but the memory occupancy rate is not very high. The fast recursive method is fast and saves memory, and is more suitable for the application of embedded systems.
Key words: Normalize Cross Correlation(NCC)     sub-image's energy     classic integral image method     fast Recurrence method    
1 引言

所谓景象匹配就是指将事先制备好的基准图与传感器拍摄的实时图进行相关运算,搜索实时图在基准图中位置的过程。目前众多相关算法中,效果最好的是归一化互相关算法(Normalized Cross Correlation, NCC),具有抵抗噪声和图像亮度变化的强鲁棒性,且匹配精度高等优点,因此,被广泛应用于景象匹配技术中。

NCC算法应用于景象匹配的场景多见于执行目标识别跟踪任务的嵌入式系统[1-4],除了对匹配精度有较高要求外,对匹配算法的运算速度和内存占用也有较高要求。对NCC算法进行优化加速,主要从两个方向进行,一是对其中的卷积运算进行加速,二是对其中计算基准子图能量的运算步骤进行加速。目前,国内外已有大量针对NCC算法中的卷积运算进行加速的研究成果[5-7],归纳一下卷积加速通常会采用两种方法:一是时域法,即将卷积运算在时间域中进行。该方法利用数字信号处理器DSP或图形处理器GPU的并行流水结构,采用所谓的乒乓算法[5-7]等进行加速运算。二是频域法,即卷积运算在频域中进行。该方法利用卷积定理,使用二维快速傅立叶变换FFT2,将卷积运算从时间域变换到频率域中进行[8-9],从而达到加速目的。对于基准子图能量的运算步骤进行加速,目前学术成果中,最为经典的为Lewis提出的积分图法[10],即将积分图像经典计算理论引入归一化积相关中,将复杂的区域像素逐一相加运算,简化成3个加减法,从而提升了运算速度。

本文重点针对NCC中计算基准子图能量的运算步骤进行加速研究。通过对经典NCC积分图法[10]进行详细分析发现,虽然积分图法过程灵活,加速明显,但在内存占用较大,对于嵌入式系统的应用,无法完全满足速度高和内存占用少的要求。因此,针对以上问题,本文提出了一种快速递推算法,其主要思想是利用相邻像素值的能量进行连续递推,计算时可以不必像积分图法那样给所有的图像能量都分配空间,只需预留1行的像素空间便能完成整个能量计算过程,因而即保证了快速的计算速度,又大大节省了内存占用。经过试验分析,在运行速度方面,基于快速递推法的NCC算法,和基于积分图法的NCC算法相比,两者运行速度相当,耗时均为传统NCC算法的1/2;在内存占用率方面,景象匹配应用中,实时图尺寸越大,快速递推法比积分图法更加节省内存,在实时图大小为32×32的条件下,快速递推法的内存占用率为积分图法的1/3;在实时图大小为350×350条件下,快速递推法的内存占用率仅为积分图法的1/8。在灵活性方面,由于快速递推算法需要连续进行递推完成,因此与经典积分图法相比,积分图法的灵活性更占优势。综上所述,本文提出的快速递推算法和经典积分图法均为加速优化传统归一化互相关算法的有效途径,两种方法各有优势,积分图法快速、灵活,但内存占用率较大,适合在非嵌入式系统进行应用;本文的快速递推法快速、内存占用小,适合在嵌入式系统中进行应用。

2 NCC中基准子图能量的定义

归一化互相关算法(Normalized Cross Correlation, NCC)是执行景象匹配的经典算法之一,其基本原理如下:设有基准图像f(高H,宽W),实时图像g(高M,宽N),满足,HMWN,在位置(rc)处,基准图与实时图的相关系数可定义为:

(1)

对式(1)的进行重新整理推导,可得更为简洁的形式:

(2)

其中:

(3)
(4)
(5)
(6)
(7)

公式(3)为基准图中的基准子图与实时图的卷积;公式(4)、(5)分别为基准图中基准子图的像素灰度平方和及像素灰度和,也称基准子图能量;公式(6)、(7)为实时图像素灰度平方和及像素灰度和。

基准图与实时图在各点的相关系数可以组成大小(H-M+1)×(W-N+1)的相关矩阵,如式(8)所示。通常,相关矩阵中相关系数最大值处就可被认为是实时图在基准图中的位置。

(8)

对于式(2),最费时间的是公式(3)所示的基准子图与实时图的卷积运算、公式(4)和(5)所示的基准子图的像素灰度平方求和以及灰度求和运算。对于实时系统和在线系统,上述三项运算往往成为使用的瓶颈。而公式(6)、(7)所示的实时图像素灰度平方求和以及灰度求和一般只进行一次运算,其运行时间可以忽略不计。

对于公式(3)NCC中卷积过程的加速运算,已有许多研究成果[5-7]。因此本文主要针对公式(4)、(5)计算基准子图能量的加速算法进行研究。分析了快速求取基准子图能量的经典积分图法的算法过程[8],以及消耗内存大的主要问题。

3 经典积分图法原理分析 3.1 积分图像基本原理

积分图像(Integral image)[11]由Crow提出,后应用在人脸识别[12]领域中,最早将积分图像用于NCC基准子图能量计算的为Lewis[10]。积分图像的定义如图 1所示,图像中任意一点(i, j)的积分值ii(i, j)、ii2(i, j),分别定义为原图像相应斜线区域灰度值和、灰度值平方和,即:

(9)
(10)
图 1 积分图像 Fig.1 Integral image

其中,p(i′, j′)表示原图像中一点(i′, j′)的灰度值,p2(i′, j′)表示原图像中一点(i′, j′)灰度值的平方。

ii(i, j)可用式(11)、(12)迭代计算得到:

(11)
(12)

灰度平方的积分图像ii2(i, j)可用式(13)、(14)迭代计算得到:

(13)
(14)

其中:S(i, j)和S′(i, j)均表示一列的积分,且S(i, -1)=0,S′(i, -1)=0,ii(-1, j)=ii2(-1, j)=0。

可以看出计算积分图像,只需将原图像所有像素扫描一遍。如果基准图可以预先确定,那么积分图像也是可以预先计算得到的,景象匹配时可将其与基准图一起预先装载在嵌入式计算机的内存中。

3.2 积分图法快速计算基准子图能量

利用积分图像快速求取基准子图能量的算法,称之为积分图法,由Lewis于1995年提出[10]。计算时主要用到了式(15)、(16)。如图 1所示,在求取图 1中窗口W内的图像能量时,不管窗口W的大小如何,均可以用积分图像的4个相应点(i1, j1)、(i2, j2)、(i3, j3)、(i4, j4)快速计算得到,即窗口W内像素的灰度或灰度平方和为:

(15)
(16)

应用时,需要将基准图的积分图像事先计算完成。那么,在求取基准子图的能量运算就可转变为式(15)、(16)的3+3个加减法运算,与传统NCC算法相比,计算速率将得到大大提升。

3.3 经典积分图法主要问题分析

经典积分图法的计算过程灵活,大大节省了运算时间。但是它最大的不足就是占用内存开销大。因为计算机的内存除了为必存的基准图预留空间外,还需给基准图像素值的积分图像ii及像素平方和的积分图像ii2分配相等的内存。从式(12)、(14)可知,积分图像中的值随着行列的增加,其值不断增大。假设一幅1 024×1 024尺寸,具有256个灰度级的基准图,考虑其中所有像素灰度值都为255的极限情况,则积分图像ii2中i=H-1,j=W-1处像素值平方和的大小就为:1 0242×2552≈210×210×28×28,占用内存36 bit。那么,用现有计算机中4 B(32 bit)的整型数就无法表示积分图像ii2中的值,而只能采用8 B(64 bit)的长整型数或双精度浮点数来表示。此时,积分图像需要的内存量为图像本身的2×8倍。显然,这样大的内存消耗在一些嵌入式系统或单片机上是难以承受的。

因此本文提出了NCC中快速计算基准子图能量的快速递推算法,详细介绍如下。

4 快速递推算法

快速递推算法的主要思想是利用图像中相邻像素值的能量进行连续递推,优势是在计算时可以不必像积分图法那样给所有的图像能量都分配空间,只需预留1行的像素空间便能完成整个能量计算过程,即保证了计算速度,又大大节省了内存占用。

4.1 基本原理

假设基准图fH、宽W,实时图gM、宽N,基准子图能量的定义如图 2所示,(i, j)处基准子图能量值A可定义为以(i, j)像素为右下角点,高为M,宽为N区域内所有像素的灰度和或灰度平方之和。同理,如图 2所示,BCD可分别定义为与(i, j)相邻的3个像素(i-1, j)、(i, j-1)和(i-1, j-1)处的能量值。

图 2 快速递推法基准子图能量定义 Fig.2 Sub-image's energy in fast recurrence method

基准子图能量A的计算方法如公式(17)所示。其中,BCD可分别为与(i, j)相邻的3个像素(i-1, j)、(i, j-1)和(i-1, j-1)处的基准子图能量值。f(i, j)、f(i-M, j-N)、f(i-M, j)和f(i, j-N)则为基准图f在该处的像素灰度值,MN为实时图g的高和宽。基于这些元素,通过对基准图f进行递推遍历运算,就可以得出每个像素位置的基准子图能量。

(17)

A处能量的具体计算推导过程如下。

图 3所示,图 3右图中的灰色部分为要计算的基准子图能量AA可由公式(18)计算得出:

(18)
(19)
(20)
(21)
图 3 计算(i, j)处基准子图能量的推导过程 Fig.3 Calculation of sub-image's energy in pixel (i, j)

计算B+D-C可得:

(22)

因此:

(23)

将式(23)代入式(18)中,便可以得到公式(17),求出A的值。

因此,已知式(17),要求(i, j)处基准子图能量A,只需先求出与其相邻像素(i-1, j)、(i-1, j-1)和(i, j-1)处的能量值B、C、D即可。由于用到的只是相邻图像能量值,因此在计算分配内存的过程中,可以不必像积分图法那样给所有的图像能量都分配空间,而只需预留1行的空间便能完成整个能量计算的过程。这种求取基准子图能量的方法,称之为快速递推法,其最大优点就是占用内存少,速度快。下面将给出快速递推法的详细算法过程,如图 4所示。

图 4 快速递推法计算图像能量的算法过程 Fig.4 Algorithm process of computing sub-image's energy by fast recurrence method
4.2 快速递推法计算基准子图能量

首先分配一个长度等于基准图f宽度W的数组Row,并将该数组内所有元素的值初始化为0。在算法运行过程中需要用基准图f每1行像素所对应的基准子图能量值Sf不断地对Row进行更新。同时设置3个变量B=0、C=0、D=0,在计算基准图f中(i, j)处的基准子图能量时,BCD将分别存储(i-1, j)、(i-1, j-1)和(i, j-1)处的能量值。

将大小为M×N的窗口g从基准图f的(0, 0)点处开始逐行遍历,至(H-1, W-1)点结束,这期间将进行如图 4所示的运算过程。

设相关矩阵为R,大小为(H-M+1)×(W-N+1)。

以上只列出了求取式(5)的算法过程,求式(4)的过程与之类似,将不再赘述。

以上算法执行过程中,快速递推法在计算一个基准子图能量时同经典积分图法一样只需要进行6个加减运算;在内存占用方面,快速递推法只需要给基准子图计算过程分配一行与基准图f的宽度W相同的存储空间,而为了保证计算速度,积分图法则需要分配2个与f尺寸H×W相同的空间用来分别存储灰度值和与灰度值平方和。可见,快速递推法在优化运算速度的前提下,有效降低了内存占用率。

5 实验与分析

为了验证本文快速递推算法的性能。本文在CPU为Intel(R) XEON(TM) 2.4 GHz 2.37 Hz,内存2 G的PC机实验环境下,使用Visual Studio 2008的C#语言,编程实现了传统归一化互相关算法、基于经典积分图法的归一化互相关算法和基于本文快速递推法的归一化互相关算法。另外为了公平起见,编程实现时归一化互相关中的卷积运算与传统算法保持了一致,没有进行加速处理。

在实验过程中首先比较了上述3种算法计算相关矩阵所花费的时间,然后比较了后两种算法计算相关矩阵时所占用的内存,最后分析讨论了将扩展后的快速递推法应用于跳跃式计算的情况。本文选用的测试基准图f分别为256×256、512×512的国外遥感卫星影像,如图 5所示。

图 5 基准图,左图大小256×256,右图 512×512 Fig.5 Basic images, left image size 256×256, right image size 512×512

实时图则为分别从各自两幅图中截取的大小为32×32~150×150的子图像。由于本文快速递推法和经典积分图法均是对传统归一化互相关算法的优化加速,因此3种算法的匹配结果是一致的,如图 6所示。

图 6 3种归一化互相关算法的匹配结果示意,右图实时图尺寸为150×150,左图为右图在512×512基准图上的匹配结果 Fig.6 Matching result of three normalized cross-correlation algorithms, left image is real-time image which size is 256×256, right image is result of left image matching with basic image which is size 512×512
5.1 时间花费对比试验

传统归一化互相关算法、基于经典积分图法的归一化互相关算法和基于本文快速递推法的归一化互相关算法的运算时间分别进行了测试。这里按照实际应用的情况,又将积分图法的计时方法按匹配方式分成两种。一是内含式匹配,即基准图尺寸大于实时图,该种情况下,由于基准图不变,它的积分图像可以事先算出,因此归一化互相关算法过程不需记录积分图像iiii2计算时间;二是穿越式匹配,即基准图尺寸小于实时图,在这种情况下匹配过程就变为在实时图中寻找基准图,由于实时图是不断变化的,它的积分图像无法事先算出,因此归一化互相关算法就需要记录积分图像iiii2的计算时间。详细的测试结果如表 12所示。

表 1 计算相关矩阵所花费的时间,基准图f大小为256×256 Tab. 1 Calculation time of correlation matrix, size of basic image f is 256×256

表 2 计算相关矩阵所花费的时间,基准图f大小为512×512 Tab. 2 Calculation time of correlation matrix, size of basic image f is 512×512

由实验结果数据可以总结出以下结论:

(1) 基于快速递推法的归一化互相关算法与基于积分图法的归一化互相关算法,两者时间花费均较不做任何加速处理的传统归一化互相关算法相大大减少,因此两者都是归一化互相关的快速算法;

(2) 快速递推法花费的时间要比不记iiii2的计算时间的积分图法略多,但是比记iiii2的计算时间的积分图法少。

5.2 内存消耗对比试验

快速递推法比积分图法更节省内存开销,为了验证这一点,这里我们仍以一幅大小为1 024×1 024,灰度级为256的基准图为例进行说明。与积分图法不同的是,快速递推法中数组Row的数据类型选择与实时图像的大小有关,如果也考虑像素值都等于255的极限情况,那么i=H-1,j=W-1处的像素值平方和就为M×N×2552。若实时图高与宽均小于256,如M×N=128×128,那么M×N×2552= 128×128×2552≈230,占用内存30 bit,此时Row的数据类型就可定义为4 B(32 bit)的长整型;若实时图高与宽均大于256,如M×N=512×512,那么M×N×2552=512×512×2552≈234,占用内存34 bit,那么Row的数据类型就必须定义为8 B(64 bit)的长长整型。

事实上,无论数组Row的数据类型如何定义,快速递推法的内存消耗都始终小于积分图法。如果实时图尺寸小于256×256,那么快速递推法分配2×4×W(B)的内存给两个数组,如果大于256×256,则分配2×8×W(B)给数组。比较于积分图法始终需要分配2×8×H×W(B)的内存给两个积分图像,快速递推法的内存开销确实是大大减小了。

在C#语言编程实现时,将基准图和实时图的数据类型定义为8位整型,积分图像定义为64位长整型;如果实时图小于256×256,快速递推法中存储能量的数组就定义为32位整型,否则为64位长整型;最后相关矩阵的类型定义为64位双精度浮点型。因此基准图、实时图占用的内存空间分别为H×WM×N(B),两幅积分图像为2×H×W×8(B),快速递推法两数组为2×W×4或2×W×8(B),相关矩阵为(H-M+1)×(W-N+1) ×8(B)。

依据以上描述,本文分别对基于积分图法和快速递推法的NCC算法所占用的内存进行了测试,此外为了验证快速递推法内存消耗低的特点,对于512×512的基准图,又添加了实时图大于256×256的情况。测试结果如表 34所示。

表 3 两种算法计算相关矩阵所占用的内存,基准图f大小为256×256 Tab. 3 Memory of computing correlation matrix, size of basic image f is 256×256

表 4 两种算法计算相关矩阵所占用的内存,基准图f大小为512×512 Tab. 4 Memory of computing correlation matrix, size of basic image f is 512×512

表 34可以看出,无论实时图的尺寸是否大于256×256,快速递推法计算相关矩阵时占用的内存总是比积分图法小很多。

5.3 灵活性对比试验

积分图法可以计算任意位置任意大小区域的像素灰度和,而且只要3步加减运算,既高效又灵活。相对而言,快速递推法只有在连续求取基准子图能量的情况下,才能保证与积分图法具有同样高的计算速度。因此在灵活性方面4.2快速递推法的算法过程不及积分图法。

为此,为了提高快速递推法的灵活性,快速递推法也可以做跳跃式地计算(跳跃式是指存在采样间隔的求和方式,即每次隔几个像素,算一次能量和)。只需要将原本表示1个像素值的4个角区域扩展为区域像素和即可,如图 6所示。但是这种扩展是存在一定限制的,并且随着采样间隔的增加,扩展后的快速递推法计算效率也会随之降低,即快速递推法要想提高灵活性必须牺牲计算速度。

图 6 快速递推法跳跃式扩展求和 Fig.6 Sum by jumping expansion of recurrence method

设采样间隔为ss=0的情况,也就是连续计算的情况,如图 6中第1幅图所示,此时快速递推法的效率最高,与积分图法相当。随着s的不断增加,图中4个角区域的像素个数也会按(s+1)2的顺序不断增多,原本只表示单个像素的4个角区域,现在要表示该区域的像素值和,而这种像素值求和,却只能按照一个一个像素依次相加的方法来做,没有其它更好的办法,因此随着s的增大,快速递推法的运算效率会变得越来越低。如:随着采样间隔按0~4的顺序增加,4个角区域内的像素个数也按照1、22、32、42和52的顺序不断增多,图中黑色区域不断减小,最终将快速递推法变为最原始的求和方式。假设实时图高为M,宽为N,当横采样间隔s1>=N-1时,或者竖采样间隔s2>=M-1时,快速递推法将起不到任何快速计算的作用,因为此时的快速递推法已经变成了最原始的求和方式,如图 6中第5幅图所示。

我们对快速递推法进行跳跃式求和计算时的效率也进行了简单的实验测试,实验按照图 6给出的过程实施。选取的实时图像大小为5×5,采样间隔为0~4,最后得到的图像能量计算时间如图 7所示。

图 7 快速递推法跳跃式扩展后计算基准子图能量的时间 Fig.7 Time of calculation for sub-image's energy by jumping expansion of recurrence method

图 7可以看出,随着采样间隔的增加,图像能量的计算时间越来越长,到最后已经达到与最原始求和方法基本相等的时间,从而验证了以上讨论的结果。

6 结论

快速递推法,同经典积分图法一样,同为归一化互相关中计算基准子图能量的快速算法,能够有效提升归一化互相关算法的计算速度,耗时均只为传统归一化互相关算法的1/2。总起来说,经典积分图法计算过程快速灵活的优势,但是占用内存大。本文提出的快速递推法,其计算过程虽然不如积分图法灵活,但是占用内存小,二者各有优点。因此如果想要充分发挥它们的优势,就需要根据应用场合,恰当使用,扬长避短。通过本文的试验分析,现将积分图法和快速递推法的适用场合总结如下:

(1) 快速递推法适合进行连续图像能量求取的应用场景,此时效率最高,例如飞行器嵌入式系统中的的快速景象匹配应用。积分图法较为灵活,可进行跳跃式运算,更适合监控等PC环境下的目标识别应用;

(2) 在内存容量较大的应用环境,如PC机环境,适合采用积分图法进行计算。而在一些对内存大小有限制的硬件环境,如DSP硬件、嵌入式系统等,则更适合采用快速递推法来计算。

参考文献
[1]
TSAI D M, LIN C T. Fast normalized cross correlation for defect detection[J]. Pattern Recognition, 2003, 24: 2625-2631. DOI:10.1016/S0167-8655(03)00106-5
[2]
徐伟, 陈彦彤, 朴永杰, 等. 基于吉林一号遥感图像的星载目标快速识别系统[J]. 光学 精密工程, 2017, 25(1): 255-262.
XU W, CHEN Y T, PIAO Y J, et al. Target fast matching recognition of on-board system based on Jilin-1 satellite image[J]. Optics and Precision Engineering, 2017, 25(1): 255-262. (in Chinese)
[3]
张浩鹏.基于互相关计算加速器的实时目标跟踪系统设计与实现[D].浙江大学, 2014.
ZHANG H P. Design and implementation of real-time target tracking system based on intercorrelation computing accelerators[D]. Zhejiang University, 2014. (in Chinese) http://cdmd.cnki.com.cn/Article/CDMD-10335-1014193685.htm
[4]
HⅡ A J H, HANN C E, CHASE J G, et al. Fast normalized cross correlation for motion tracking using basis functions[J]. Computer Methods and Programs in Biomedicine, 2006, 82(2): 144-156. DOI:10.1016/j.cmpb.2006.02.007
[5]
ARMELLONI E, GIOTTOLI C, FARINA A, et al.. Implementation of realtime partitioned convoluti-on on a DSP board[C]. 2003 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, NY, 2003.10, 19-22. http://ieeexplore.ieee.org/xpls/icp.jsp?arnumber=1285822
[6]
田立, 周付根, 孟偲, 等. 互相关跟踪算法的多核DSP快速实现[J]. 高技术通讯, 2013, 23(12): 1248-1253.
TIAN L, ZHOU F G, MENG S, et al. Fast implementation of multi-core DSP for intercorrelation tracking algorithm[J]. High-tech Communications, 2013, 23(12): 1248-1253. DOI:10.3772/j.issn.1002-0470.2013.12.006 (in Chinese)
[7]
刘毅飞, 张旭明, 丁明跃. 归一化互相关灰度图像匹配的多核信号处理器实现[J]. 计算机应用, 2011, 31(12): 3334-3336.
LIU Y F, ZHANG X M, DING M Y. Implementation of a Multicore Signal Processor for Normali-zed Intercorrelation Grayscale Image Matching[J]. Computer Application, 2011, 31(12): 3334-3336. (in Chinese)
[8]
JAE C Y, HAN T Y. Fast normalized cross-correlation[J]. Circuits, Systems and Signal Processing, 2009, 28: 819-843. DOI:10.1007/s00034-009-9130-7
[9]
ARIE N, ALLEN T. A new distance measure based on generalized Image Normalized Cross-Correlation for robust video tracking and image recognition[J]. Pattern Recognition Letters, 2013, 34(3).
[10]
LEWIS J P. Fast normalized cross-correlation[J]. in Proceedings of Vision Interface, 1995, 120-123.
[11]
FRANKLIN C CROW. Summed-area tables for texture mapping[J]. Computer Graphics, 1984, 18(3).
[12]
PAUL VIOLA, MICHEAL J JONES. Robust real-time face detection[J]. International Journal of Co-mputer Vision, 2004, 57(2): 137-154. DOI:10.1023/B:VISI.0000013087.49260.fb
[13]
卢宇, 卢荣胜, 郭广平, 等. 基于快速归一化算法的拉伸距离动态跟踪测量[J]. 传感技术学报, 2016, 29(9): 1328-1334.
LU Y, LU R S, GUO G P, et al. Dynamic tracking measurement of stretching distance based on fast normalization algorithm[J]. Journal of sensing technology, 2016, 29(9): 1328-1334. DOI:10.3969/j.issn.1004-1699.2016.09.005 (in Chinese)
[14]
陈冰倩.基于CPU的归一化互相关算法波前斜率技术研究[D].中国科学院研究生院(光电技术研究所), 2016.
CHEN B Q. Research on wavefront slope based on normalized cross correlation algorithm based on CPU[D]. Graduate University of Chinese Academy of Sciences (Institute of Optoelectronic Technology), 2016.(in Chinese)