Linux GCC下strstr的实现以及一个简单的Kmp算法的接口
今天做了一道题,要用判断一个字符串是否是另一个字符串的子串,于是查了一下strstr的实现。
代码如下:
1 char *strstr(const char*s1,const char*s2) 2 { 3 const char*p=s1; 4 const size_t len=strlen(s2); 5 for(;(p=strchr(p,*s2))!=0;p++) 6 { 7 if(strncmp(p,s2,len)==0) 8 return (char*)p; 9 } 10 return(0); 11 }
从上面的GCC中strstr实现代码可以分析出,strstr的时间复杂度是O(n2)的(因为strncmp是O(N)的),不过对长字符串匹配子串上可以采用kmp算法来提高效率(时间复杂度为O(m+n)),这里翻出了自己以前写的kmp算法的接口放到这里和大家分享一下,之前我也写过一篇关于kmp匹配子串的一篇文章,也可以去看一下。
这是我之前写的关于kmp介绍的文章地址:http://www.cnblogs.com/daimadebanyungong/p/4756853.html
下面是我翻出来的很早之前写的一个C版本的kmp算法的实现接口,欢迎纠正错误和分享经验。
1 #include <string.h> 2 #include <stdio.h> 3 4 #define LIB_MATCH_NUM 5 5 #define LIB_STRING_LEN 40 6 7 char lib_match[LIB_MATCH_NUM][LIB_STRING_LEN] = 8 { 9 "www.baidu.comw", 10 "www.google.com", 11 "www", 12 "baidu.com", 13 "lualu", 14 }; 15 16 int lib_match_len[LIB_MATCH_NUM]; 17 18 int lib_match_next[LIB_MATCH_NUM][LIB_STRING_LEN + 1] = {0}; 19 20 21 void get_next(); 22 23 void lib_match_init() 24 { 25 memset(lib_match_len,0,sizeof(lib_match_len)); 26 int i; 27 for(i = 0; i < LIB_MATCH_NUM; i++) 28 { 29 lib_match_len[i] = strlen(lib_match[i]); 30 } 31 32 get_next(); // init next array 33 } 34 35 void get_next() 36 { 37 int i,j,k; 38 39 for(i = 0; i < LIB_MATCH_NUM; i++) 40 { 41 42 lib_match_next[i][0] = 0; 43 lib_match_next[i][1] = 0; 44 45 k = 0; //point to the last next[j] 46 int len = lib_match_len[i]; 47 48 for( j = 1; j < len; j++) 49 {//j start from 1 because next start from 2 50 k = lib_match_next[i][j]; //k = next[j]; 51 52 while(k > 0 && lib_match[i][j] != lib_match[i][k]) 53 { 54 k = lib_match_next[i][k]; 55 } 56 57 if(lib_match[i][j] == lib_match[i][k]) 58 {//s[j] == s[next[k]] next[i+1] = next[k] +1 59 k++; 60 } 61 62 lib_match_next[i][j+1] = k; 63 } 64 65 } 66 67 } 68 69 int lib_search(char *orignal,int len) 70 { 71 if(orignal == NULL) 72 { 73 return 0; 74 } 75 76 int i,j,k; 77 78 for(i = 0; i < LIB_MATCH_NUM; i++) 79 { 80 char *tmp = orignal; // match each model need to start from the first 81 k = 0; // k start from the last next array 82 83 for(j = 0; j < len; j++) 84 { 85 86 while( k > 0 && tmp[j] != lib_match[i][k]) 87 { 88 k = lib_match_next[i][k]; 89 } 90 91 if(tmp[j] == lib_match[i][k]) 92 { 93 k++; 94 } 95 96 if(k == lib_match_len[i]) 97 { 98 printf("match the model string %d : %s ", i,lib_match[i]); 99 printf("match at the position :%d ", j - lib_match_len[i] + 1); 100 101 // here can return the i to know which model string have been matched 102 103 k = lib_match_next[i][k]; //to match another this model string 104 } 105 106 } 107 108 } 109 110 return 0; 111 } 112 113 void print_next() 114 { 115 int i,j; 116 117 for(i = 0; i < LIB_MATCH_NUM; i++) 118 { 119 printf("model string : %s ",lib_match[i]); 120 printf("next array:"); 121 for(j = 0; j < lib_match_len[i]+1;j++) 122 { 123 printf(" %d",lib_match_next[i][j]); 124 } 125 printf(" "); 126 } 127 } 128 129 130 int main() 131 { 132 char orignal[40]; 133 134 lib_match_init(); 135 136 print_next(); 137 138 while(1) 139 { 140 141 scanf("%s",orignal); 142 143 if(strcmp(orignal,"0") == 0) 144 { 145 return 0; 146 } 147 148 lib_search(orignal,strlen(orignal)); 149 } 150 151 return 0; 152 153 }