heritrix相关有关问题 急需指导
heritrix相关问题 急需指导
请问heritrix有一些什么样的扩展点?
如果我想对趴取的内容限制在某个网页的 <table>块内要怎么去实现呢?
另外如何设置趴取的层数呢?我只想趴取某个网页上的一些url而且不想深入的再去趴取更多的~
另外希望高手能加我,有问题请教了~~
谢谢你们~qq:670924884
------解决方案--------------------
把趴取的内容限制在某个网页的 <table>块内,这个不行吧?楼主如果实现了,也教教我吧……
如果只想趴取某个网页上的一些url而且不想深入的再去趴取更多的,这个可以,你可以自定义Extractor类来实现……
请问heritrix有一些什么样的扩展点?
如果我想对趴取的内容限制在某个网页的 <table>块内要怎么去实现呢?
另外如何设置趴取的层数呢?我只想趴取某个网页上的一些url而且不想深入的再去趴取更多的~
另外希望高手能加我,有问题请教了~~
谢谢你们~qq:670924884
------解决方案--------------------
把趴取的内容限制在某个网页的 <table>块内,这个不行吧?楼主如果实现了,也教教我吧……
如果只想趴取某个网页上的一些url而且不想深入的再去趴取更多的,这个可以,你可以自定义Extractor类来实现……