Windows下 Robhess SIFT源码配置

Robhess OpenSIFT 源码下载:传送门

为了进一步学习SIFT,选择论文就着代码看,在VS2013、OpenCV2.4.13下新建项目,跑一跑经典之作。由于将代码和Opencv配置好后还会有些错误提示,所以下面是代码的一些改动之处。(试了下其实还是ubuntu下更方便,因为有许多参数或者命令是linux下的,当然windows下可以进行一些修改后利用)。

大前提:opencv配置好。剩下的都可以通过修改来搞定。

首先看看解压后的文件,我们只需要头文件和源文件:

Windows下 Robhess SIFT源码配置Windows下 Robhess SIFT源码配置

                                              头文件:6个                                                                                                                          源文件:10个

注意直接运行肯定不行,因为有几个文件比较特殊,下面对所有头、源文件进行解释:

1)imgfeatures.c 和 imgfeatures.h:

有SIFT特征点结构struct feature的定义,除此之外还有一些特征点的导入导出以及特征点绘制函数的声明,对应的imgfeatures.c文件中是特征点的导入导出以及特征点绘制函数的实现。

2)utils.c 和 utils.h:

这两个文件中是一些图像基本操作的函数,包括:获取某位置的像素点,设置某位置的像素点(8位,32位和64位),计算两点之间的距离的平方,在图片某一点画一个“X”,将两张图片合成为一个(在特征匹配中用到),高是二者之和,宽是二者的较大者。

3)minpq.c 和 minpq.h

这两个文件中实现了最小优先级队列(Minimizing Priority Queue),也就是小顶堆,在k-d树的建立和搜索过程中要用到。

4)kdtree.c 和 kdtree.h

这两个文件中实现了k-d树的建立以及用BBF(Best Bin First)算法搜索匹配点的函数。如果需要对两个图片中的特征点进行匹配,就要用到这两个文件。

5)xform.c 和 xform.h:

这两个文件中实现了RANSAC算法(RANdom SAmple Consensus 随机抽样一致)。RANSAC算法可用来筛选两个图像间的SIFT特征匹配并计算变换矩阵。可以单利用RANSAC算法筛选两个图像间的SIFT特征匹配,以得到更好的匹配结果,很经典的算法,值得学习。

6)sift.c 和 sift.h:   

论文里最主要的内容在此,里面的内容就是两个特征点检测函数sift_features()和 _sift_features(),sift_features()是用默认参数进行特征点检测, _sift_features()允许用户输入各种检测参数,其实sift_features()中也是再次调用_sift_features()函数。所以只需提供原图像和存储特征点的数组以及其他一些检测参数,然后调用sift_features()或 _sift_features()就可完成SIFT特征点检测。

7)siftfeat.c :含有main函数,用来实现特征点的检测,返回特征点数目和标记特征点的图像。(主要用到)

8)match.c 含有main函数, 检测两张图中的sift特征点,然后找到特征点的匹配对。(主要用到)

9)match_num.c 含有main函数,检测sift特征点,但是用到了linux下的多线程编程,所以这里暂时不做讨论。

10)dspfeat.c : 含有main函数,可以从预先保存的特征点文件中读取特征点并显示在图片上。

 

一. 修改代码

第一步:将代码中所有头文件源文件中的声明改一下:

修改前:

#include <cv.h>
#include <cxcore.h>
#include <highgui.h>

修改后:

#include <opencv/cv.h>
#include <opencv/cxcore.h>
#include <opencv/highgui.h>

修改原因:因为直接利用找不到opencv路径,所以调整路径。

第二步:修改源文件代码:

1. sift.c:

将函数   static IplImage*** build_gauss_pyr( IplImage* base, int octvs, int intvls, double sigma ) 中的代码进行改动:

修改前:

  const int _intvls = intvls;
  double sig[_intvls+3], sig_total, sig_prev, k;

修改后:

  const int _intvls = intvls;
  double *sig = (double*)malloc(sizeof(double)*(_intvls+3)); 
  double sig_total, sig_prev, k;
...
free(sig); //子函数返回前释放内存

修改原因:

源代码中用变量_intvls+3作为数组的长度,但是VC的编译器不是GCC,它不允许这样做。DEV-C++使用的编译器是GCC,它允许使用变量作为数组的长度定义数组。

当然利用C++中的new或者vector也可以。参考new、delete与malloc、free区别

2. utils.c

首先删除这两行:

#include <gdk/gdk.h>
#include <gtk/gtk.h>

为啥删掉?

gtk是一个功能强大、设计灵活的一个通用图形库,是GNU/Linux下开发图形界面的应用程序的主流开发工具之一,GTK+也有Windows版本和Mac OS X版。在作者的源码中gtk用来调整窗口来显示图像,因为我懒于装gtk,所以直接利用opencv进行显示,所以这里需要修改一些opencv的东西。

将函数进行改动:

修改前:

 1 void display_big_img( IplImage* img, char* title )
 2 {
 3   IplImage* small;
 4   GdkScreen* scr;
 5   int scr_width, scr_height;
 6   double img_aspect, scr_aspect, scale;
 7 
 8   /* determine screen size to see if image fits on screen */
 9   gdk_init( NULL, NULL );
10   scr = gdk_screen_get_default();
11   scr_width = gdk_screen_get_width( scr );
12   scr_height = gdk_screen_get_height( scr );
13 
14   if( img->width >= 0.90 * scr_width  ||  img->height >= 0.90 * scr_height )
15     {
16       img_aspect = (double)(img->width) / img->height;
17       scr_aspect = (double)(scr_width) / scr_height;
18       
19       if( img_aspect > scr_aspect )
20     scale = 0.90 * scr_width / img->width;
21       else
22     scale = 0.90 * scr_height / img->height;
23 
24       small = cvCreateImage( cvSize( img->width * scale, img->height * scale ),
25                  img->depth, img->nChannels );
26       cvResize( img, small, CV_INTER_AREA );
27     }
28   else
29     small = cvCloneImage( img );
30   
31   cvNamedWindow( title, 1 );
32   cvShowImage( title, small );
33   cvReleaseImage( &small );
34 }
View Code

修改后:

void display_big_img(IplImage* img, char* title)
{
    cvNamedWindow(title, 0);   //参数0表示生成的窗口大小可调整,参数1表示窗口自适应图像而用户不可调整,所以我选择参数0
    cvShowImage(title, img);
    cvReleaseImage(&img);
}

3. siftfeat.c

注释掉下面一行:

#include <unistd.h>

原因:顾名思义,unistd.h是unix std的意思,是POSIX标准定义的unix类系统定义符号常量的头文件,所以在windows下先注释掉。

然后注释掉下面这两个函数:static void arg_parse( int argc, char** argv ) 和 static void usage( char* name )

  1 static void arg_parse( int argc, char** argv )
  2 {
  3   //extract program name from command line (remove path, if present)
  4   pname = basename( argv[0] );
  5 
  6   //parse commandline options
  7   while( 1 )
  8     {
  9       char* arg_check;
 10       int arg = getopt( argc, argv, OPTIONS );
 11       if( arg == -1 )
 12     break;
 13 
 14       switch( arg )
 15     {
 16       // catch unsupplied required arguments and exit
 17     case ':':
 18       fatal_error( "-%c option requires an argument
"        
 19                "Try '%s -h' for help.", optopt, pname );
 20       break;
 21 
 22       // read out_file_name
 23     case 'o':
 24       if( ! optarg )
 25         fatal_error( "error parsing arguments at -%c
"    
 26              "Try '%s -h' for help.", arg, pname );
 27       out_file_name = optarg;
 28       break;
 29 
 30       // read out_img_name
 31     case 'm':
 32       if( ! optarg )
 33         fatal_error( "error parsing arguments at -%c
"    
 34              "Try '%s -h' for help.", arg, pname );
 35       out_img_name = optarg;
 36       break;
 37       
 38       // read intervals
 39     case 'i':
 40       // ensure argument provided
 41       if( ! optarg )
 42         fatal_error( "error parsing arguments at -%c
"    
 43              "Try '%s -h' for help.", arg, pname );
 44       
 45       // parse argument and ensure it is an integer
 46       intvls = strtol( optarg, &arg_check, 10 );
 47       if( arg_check == optarg  ||  *arg_check != '