变位词-【编程珠玑】
变位词--【编程珠玑】
重拾《编程珠玑》,再看一遍,之前未仔细看的或是忽略的,希望这次能有更丰富的收获;
好,如题,变位词:一种把某个词或句子的字母的位置(顺序)加以改换所形成的新词,英文叫做anagram,词典把这个词翻译成“变位词”。
书中将这个程序按三个阶段的“管道”组织,其中一个程序的输出文件作为下一个程序的输入文件。第一类程序标识单词,第二个程序排序标识后的文件,而第三个程序将这些单词压缩为每个变位词类一行的形式。
其中签名,排序,挤压(这翻译的...)即为sign,sort,squash,
sign程序:
#include <stdio.h> #include <stdlib.h> #include <string.h> #define WORDMAX 100 int charcomp(char *x, char *y) { return *x - *y; } int main() { char word[WORDMAX], sig[WORDMAX]; while (scanf("%s", word) != EOF) { strcpy(sig, word); qsort(sig, strlen(sig), sizeof(char), charcomp); printf("%s %s\n", sig, word); } return 0; }sort程序:文中说是使用系统的sort,所以就使用了,自己编写感觉有点麻烦;
squash程序:
#include <stdio.h> #include <stdlib.h> #include <string.h> #define WORDMAX 100 int main() { char word[WORDMAX], sig[WORDMAX], oldsig[WORDMAX]; int linenum = 0; strcpy(oldsig, ""); while (scanf("%s %s", sig, word) != EOF) { if (strcmp(oldsig, sig) != 0 && linenum > 0) printf("\n"); strcpy(oldsig, sig); linenum++; printf("%s ", word); } printf("\n"); return 0; }三个程序的功能:
sigh程序是将每个单词按照字母a-z进行排序,并将其放置前面,如pans,按字母排序即为anps,故而但是pans的sign为anps pans;
sort程序即是将类如anps pans进行排序;
squash程序即是来找到变位词,在同一行输出;
这里还有另外一个问题,我们发现sign程序和squash程序都是在main里面的,和我们一般的程序运行不同,所以说书中的程序按照三个阶段的“管道”组织(有读者朋友说是作者没考虑清楚,其实这是错怪了);
我们将sign和squash的执行文件与目标的字典放在一个文件夹里;
如我们将其放在一文件夹中,放在D盘中:
这时 运行 -> cmd -> 到目标文件夹 -> sign <dictionary.txt | sort | squash >gramlist.txt
这两个txt文件中内容与第一幅截图中的头尾两个图类似:
当然若是有一个更大的dictionary来测试那就更好,可以找到整本字典的变位词;
大家有兴趣不妨试试,O(∩_∩)O