用SAX解析html,有什么比较好用的包吗?解决方案
用SAX解析html,有什么比较好用的包吗?
rt
------解决方案--------------------
SAX是解析XML文件的一种方法,使用SAX只能解析XHTML文件.
如果是使用C语言,最经典的SDK库就是expat了:
http://expat.sourceforge.net/
------解决方案--------------------
解析XHTML可以用我们封装的DOM,SAX API程式库
http://resource.netsoftlab.ca/topic.php?a=disp&id=8
技术支持: ericwang[at]netsoftlab.ca
------解决方案--------------------
nutch里面提供了一个html的解析接口。
生成一个解析树,蛮好用。就是解析速度有点慢,可能一个文件要几十到几百ms。
------解决方案--------------------
http://sourceforge.net/projects/htmlparserjava 的htmlparser.
rt
------解决方案--------------------
SAX是解析XML文件的一种方法,使用SAX只能解析XHTML文件.
如果是使用C语言,最经典的SDK库就是expat了:
http://expat.sourceforge.net/
------解决方案--------------------
解析XHTML可以用我们封装的DOM,SAX API程式库
http://resource.netsoftlab.ca/topic.php?a=disp&id=8
技术支持: ericwang[at]netsoftlab.ca
------解决方案--------------------
nutch里面提供了一个html的解析接口。
生成一个解析树,蛮好用。就是解析速度有点慢,可能一个文件要几十到几百ms。
------解决方案--------------------
http://sourceforge.net/projects/htmlparserjava 的htmlparser.