抓取网页后,怎么对网页中的HTML进行处理?

抓取网页后,如何对网页中的HTML进行处理????
对爬取后的HTML,如何对其进行处理?

比如拟获得某<tr>标记之间的文本内容。

------解决方案--------------------
HTMLparser
------解决方案--------------------
<tr>(.+?)</tr>
就可以了,RegexExpressions
------解决方案--------------------
用HTMLparser,
------解决方案--------------------
你想达到什么目的呢?
------解决方案--------------------