lucene海量数据查询速度优化,以及搜索结果分组统计有关问题

lucene海量数据查询速度优化,以及搜索结果分组统计问题。




问题1:如何在大数据量上提升查询速度,目前我项目中8亿个文档数,100GB索引文件。查询单一组词平均需要7秒左右,结果一般在1亿条左右(查询的中文)。求如何提升速度。

问题2: 关于lucene 3.3 后的分组统计问题。尤其是BlockGroupingCollector.java这个类的使用,关于该类涉及到的lastDocInBlock 这个filter 要怎么在建立索引的时候控制。


项目急需。