如何建立索引,加快文本检索

如何建立索引,加快文本检索

问题描述:

怎样利用某种数据结构,然后建立起某种索引,加快文本检索速度,如果有类似于word的查找算法实现最好不过了,求大神指教,谢了

word的查找算法效率并不高,它就是顺序查找。要想做文本检索,可以使用倒排索引。对于中文来说,首先需要分词。
倒排索引的原理就是将文本中的单词提取出来,建立单词->对应文章位置的映射关系,这样直接通过关键字就能找到文本了。
具体实现google:倒排索引 全文检索